智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

          昆侖萬維Skywork-OR1系列模型:業(yè)界領(lǐng)先,全面開源免費,助力開發(fā)者

             發(fā)布時間:2025-04-13 22:56 作者:江紫萱

          昆侖萬維近日宣布,其天工團(tuán)隊在邏輯推理大模型領(lǐng)域取得了新的突破。基于首款中文邏輯推理大模型Skywork-o1,團(tuán)隊推出了全面升級的Skywork-OR1(Open Reasoner 1)系列模型。

          據(jù)悉,Skywork-OR1系列模型在邏輯推理性能上達(dá)到了業(yè)界領(lǐng)先水平,成功突破了大模型在邏輯理解與復(fù)雜任務(wù)求解方面的瓶頸。尤為昆侖萬維決定將這一系列模型全面開放并免費提供給開發(fā)者社區(qū),以完全開源的形式助力技術(shù)創(chuàng)新。

          此次開源涵蓋了三款高性能模型:Skywork-OR1-Math-7B,這是一款專注于數(shù)學(xué)領(lǐng)域的專項模型,同時擁有出色的代碼生成能力;Skywork-OR1-7B-Preview,融合了數(shù)學(xué)與代碼能力,是一款兼具通用性與專業(yè)性的模型;以及Skywork-OR1-32B-Preview,面向更高復(fù)雜度的任務(wù),具備更強(qiáng)的推理能力,堪稱旗艦版本。

          昆侖萬維采取了業(yè)界最高透明度的開源策略,不僅全面開源了模型權(quán)重和訓(xùn)練數(shù)據(jù)集,還提供了完整的訓(xùn)練代碼。所有資源均已在GitHub和Huggingface平臺上公開,為開發(fā)者提供了極大的便利。昆侖萬維還在Notion平臺上發(fā)布了配套的技術(shù)博客,詳細(xì)闡述了數(shù)據(jù)處理流程、訓(xùn)練方法和關(guān)鍵技術(shù)發(fā)現(xiàn),為社區(qū)提供了可復(fù)現(xiàn)的實踐參考。

          目前,Skywork-OR1-7B和Skywork-OR1-32B的能力仍在持續(xù)提升中。昆侖萬維透露,將在兩周內(nèi)發(fā)布這兩個模型的正式版本,并推出更為系統(tǒng)詳盡的技術(shù)報告,分享在推理模型訓(xùn)練中的經(jīng)驗與洞察。

          在數(shù)學(xué)推理任務(wù)中,Skywork-OR1系列模型展現(xiàn)出了強(qiáng)大的實力。通用模型Skywork-OR1-7B-Preview和Skywork-OR1-32B-Preview在AIME24與AIME25數(shù)據(jù)集上均實現(xiàn)了同參數(shù)規(guī)模下的最優(yōu)表現(xiàn)。而針對數(shù)學(xué)場景深度優(yōu)化的專項模型Skywork-OR1-Math-7B更是取得了令人矚目的成績,在AIME24和AIME25上分別獲得了69.8和52.3的高分,遠(yuǎn)超當(dāng)前主流7B級別模型。

          在競賽編程任務(wù)中,Skywork-OR1系列模型同樣表現(xiàn)出色。通用模型Skywork-OR1-7B-Preview與Skywork-OR1-32B-Preview在LiveCodeBench數(shù)據(jù)集上均取得了同等參數(shù)規(guī)模下的最優(yōu)性能。特別是Skywork-OR1-32B-Preview,其代碼生成與問題求解能力已接近參數(shù)規(guī)模高達(dá)671B的DeepSeek-R1,實現(xiàn)了卓越的性價比。

          Skywork-OR1-Math-7B不僅在數(shù)學(xué)推理任務(wù)上表現(xiàn)出色,還在代碼任務(wù)上展現(xiàn)出了較強(qiáng)的泛化能力。通過多階段GRPO訓(xùn)練,該模型在復(fù)雜數(shù)學(xué)問題上實現(xiàn)了卓越表現(xiàn),同時在代碼評測基準(zhǔn)Livecodebench上的表現(xiàn)也從37.6%提升到43.6%,相比基線模型有了顯著提升。

          Skywork-OR1-Math-7B的最終模型在AIME24和AIME25上的準(zhǔn)確率分別達(dá)到69.8%和52.3%,超越了OpenAI-o3-mini (low),達(dá)到了當(dāng)前尺寸下的最優(yōu)性能。這一成績不僅驗證了昆侖萬維天工團(tuán)隊訓(xùn)練策略的有效性,也展示了Skywork-OR1系列模型在邏輯推理和代碼生成方面的強(qiáng)大實力。

           
           
          更多>同類內(nèi)容
          全站最新
          熱門內(nèi)容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數(shù)碼群

          久久国产精品久久久| 国产av无码专区亚洲国产精品 | 99久久免费中文字幕精品| 91精品国产高清91久久久久久| 亚洲?V乱码久久精品蜜桃| 日韩a无v码在线播放| 国产精品国产三级国产av中文| 在线精品一区二区三区电影| 国产精品久久久久蜜芽| 亚洲精品国产精品国自产网站| 精品永久久福利一区二区| 亚洲AV日韩精品久久久久| 国产精品国产三级国产普通话| 亚洲精品无码永久在线观看你懂的 | 国产大片91精品免费看3| 国产视频精品免费| 在线精品日韩一区二区三区| 婷婷99视频精品全部在线观看| 亚洲AV无码成人精品区日韩| 亚洲日韩一区精品射精| 亚洲日本久久久午夜精品| 琪琪精品视频在线观看| 亚洲精品无码久久久久YW| 亚洲国产精品99久久久久久| 日本精品人妻无码免费大全| 免费无码精品黄AV电影| 国产Av一区二区精品久久| 国产精品你懂的在线播放| 国语精品91自产拍在线观看二区| 野花国产精品入口| 国产精品亚洲一区二区三区| 午夜国产精品久久影院| 日韩AV东京社区男人的天堂| 日韩中文字幕电影| 精品人妻AV区波多野结衣| 伊在人亚洲香蕉精品区麻豆| 亚洲精品97久久中文字幕无码| 国产精品女人呻吟在线观看| 国产精品高清免费网站| 久久免费国产精品| 国产午夜精品久久久久免费视|