智快網 - 新科技與新能源行業網絡媒體

          DeepSeek-GRM:以極低成本挑戰AI訓練高峰,性能直逼GPT-4o!

             發布時間:2025-04-08 10:58 作者:任飛揚

          近期,一項創新的人工智能技術引起了廣泛關注。據一項4月4日發布的最新研究顯示,該技術采用了一種獨特的遞歸架構,使得模型在推理過程中能夠自我修正輸出,極大地提升了準確性和效率。

          這項名為SPCT的技術分為兩個階段實施。在第一階段,即冷啟動階段,通過拒絕式微調,讓模型適應不同類型的輸入,并以正確的格式生成原則和點評內容。隨后進入第二階段,即基于規則的在線強化學習階段,這一階段采用規則獎勵機制,鼓勵模型生成更加精準的原則和點評,從而增強了推理階段的可擴展性。

          在實際測試中,使用了擁有270億參數的DeepSeek-GRM模型。通過每查詢32次采樣的推理計算,該模型的表現達到了671B規模模型的性能水平。這一硬件感知設計融合了混合專家系統(MoE),支持高達128k token的上下文窗口,并且單查詢延遲僅為1.4秒,表現出色。

          研究報告進一步指出,SPCT技術顯著降低了高性能模型的部署成本。以DeepSeek-GRM模型為例,其訓練成本約為1.2萬美元(按當前匯率約合87871元人民幣),在MT-Bench測試中的得分高達8.35。相比之下,擁有340B參數的Nemotron-4模型需要120萬美元的訓練成本才能獲得8.41的得分,而OpenAI的GPT-4o模型,盡管得分高達8.72,但其訓練成本更是高達630萬美元(按當前匯率約合4613.2萬元人民幣),是DeepSeek-GRM成本的525倍之多。

          SPCT技術還帶來了其他顯著優勢。據研究團隊介紹,該技術減少了90%的人工標注需求,并且在能耗方面相比傳統方法降低了73%。這一突破為實時機器人控制等動態場景提供了新的可能性,預示著人工智能技術在未來將有更加廣泛的應用。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          国产精品青草久久| 亚洲精品456人成在线| 精品久人妻去按摩店被黑人按中出 | 91精品婷婷国产综合久久| 久久久精品2019中文字幕之3| 在线精品亚洲一区二区三区 | 国内精品免费视频精选在线观看| 国产国拍亚洲精品福利| 日韩毛片无码永久免费看| 日韩在线观看网站| 国产在线精品美女观看| 国产精品情侣呻吟对白视频| 国语精品91自产拍在线观看二区 | 国产日韩精品无码区免费专区国产 | 国产91精品新入口| 国产精品好好热在线观看| 成人国产精品秘片多多| 久久久国产精品无码一区二区三区 | 久久精品视频在线看99| 亚洲а∨精品天堂在线| 人妻精品久久无码区洗澡| 色综合久久精品亚洲国产| 国产69精品久久久久APP下载 | 国产精品午夜无码体验区| 精品三级内地国产在线观看| 精品国产一区在线观看| 精品72久久久久久久中文字幕| 精品伊人久久久久网站| 尤物国产精品福利三区| 国产精品特黄毛片| 日韩在线一区二区三区免费视频| 国产剧情精品在线| 亚洲国产日韩在线成人蜜芽 | 精品乱人伦一区二区三区| 国产精品午睡沙发系列| 国产成人亚洲精品青草天美| 久久国产精品免费专区| 99久久99热精品免费观看国产| 竹菊影视国产精品| 最新在线精品国自产拍网站| 2020年国产精品|