智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

          DeepSeek-Prover-V2數(shù)學(xué)推理新突破,88.9%通過率引領(lǐng)AI新標(biāo)桿!

             發(fā)布時間:2025-05-01 10:14 作者:唐云澤

          近日,AI 開源社區(qū) Hugging Face 迎來了一項新成果,深度求索(DeepSeek)團隊發(fā)布了名為 DeepSeek-Prover-V2-671B 的大型語言模型。與此同時,該團隊還在 GitHub 等平臺分享了相關(guān)論文,詳細介紹了這一新模型的特性和成就。

          DeepSeek-Prover-V2 是一款專注于形式化數(shù)學(xué)推理的開源模型,其基礎(chǔ)是 DeepSeek-V3-0324。為了生成訓(xùn)練所需的初始數(shù)據(jù),團隊采用了遞歸定理證明管道的方法。這一創(chuàng)新使得模型在處理復(fù)雜數(shù)學(xué)問題時,能夠展現(xiàn)出更高的精確度和效率。

          DeepSeek 團隊推出了兩個版本的模型:DeepSeek-Prover-V2-671B 和 DeepSeek-Prover-V2-7B。前者結(jié)合了 V3 基礎(chǔ)大模型的優(yōu)點,后者則是一個增強模型。團隊還發(fā)布了 DeepSeek-ProverBench 數(shù)據(jù)集,為評估模型性能提供了有力工具。

          DeepSeek-Prover-V2-671B 的架構(gòu)與 DeepSeek V3-0324 相同,但其應(yīng)用場景卻大相徑庭。這款模型并非用于常規(guī)對話或推理,而是專注于形式化定理證明,專門增強了數(shù)學(xué)能力。為了實現(xiàn)這一目標(biāo),團隊采用了復(fù)雜的策略。

          首先,他們引導(dǎo) DeepSeek-V3 模型將復(fù)雜的數(shù)學(xué)定理分解為一系列子目標(biāo)。這一步驟整合了非形式化與形式化數(shù)學(xué)推理,使得模型能夠在 Lean 4 平臺上逐步完成形式化證明。接著,團隊利用一個較小的 7B 參數(shù)模型來處理這些子目標(biāo)的證明搜索,從而大大減輕了計算負擔(dān)。

          在訓(xùn)練過程中,團隊精心篩選了一批難題,這些難題雖然 7B 模型無法直接解決,但其子目標(biāo)已被證明。通過整合這些子目標(biāo)的證明,團隊形成了完整的形式化證明,并與 DeepSeek-V3 的推理過程對接,生成了豐富的合成數(shù)據(jù)。這些數(shù)據(jù)為模型的微調(diào)提供了堅實的基礎(chǔ)。

          隨后,團隊利用強化學(xué)習(xí)進一步提升模型的能力。他們以二元反饋(正確或錯誤)作為獎勵機制,通過不斷的試錯和優(yōu)化,使得 DeepSeek-Prover-V2-671B 在神經(jīng)定理證明領(lǐng)域取得了顯著進展。在 MiniF2F-test 數(shù)據(jù)集上,該模型的通過率達到了 88.9%,在 PutnamBench 數(shù)據(jù)集中也成功解決了 49 個問題。

          為了推動模型在多樣化場景下的測試與應(yīng)用,DeepSeek 團隊還發(fā)布了 ProverBench 基準(zhǔn)數(shù)據(jù)集。該數(shù)據(jù)集包含了 325 個形式化數(shù)學(xué)問題,其中 15 個問題源自近期的 AIME 競賽,涉及數(shù)論與代數(shù)等高中競賽難度的內(nèi)容。其余 310 個問題則涵蓋了線性代數(shù)、微積分、概率等多個領(lǐng)域,為高中競賽和本科數(shù)學(xué)提供了全面的評估標(biāo)準(zhǔn)。

           
           
          更多>同類內(nèi)容
          全站最新
          熱門內(nèi)容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數(shù)碼群

          亚洲乱码日产精品BD在线观看| 久久免费观看国产精品| 国产精品无码日韩欧| 国产精品99久久不卡| 久久久国产精品四虎| 99久久国产综合精品1尤物| 国产精品涩涩涩视频网站| 综合国产精品第一页| 久久99精品久久久久久秒播| 日韩精品电影一区亚洲| 日韩在线a视频免费播放| 亚洲视频日韩视频| 国产热re99久久6国产精品| 精品久久天干天天天按摩| 亚洲精品国产精品| 亚洲日韩精品国产一区二区三区| 精品9E精品视频在线观看 | 亚洲精品美女久久久久| 一级香蕉精品视频在线播放| 久久精品视频99精品视频150| 日本人精品video黑人| 国产成人精品白浆久久69| 日本久久久精品中文字幕| 日本精品不卡视频| 国产精品美女久久久m| 久久青草精品38国产| 久久99精品久久久久久综合 | 久久久久久精品免费看SSS| 99久久精品美女高潮喷水| 91国语精品自产拍在线观看一| 91freevideos精品| 四虎永久在线观看视频精品| 国产精品一区二区久久| 一本色道久久综合亚洲精品蜜桃冫 | 亚洲av日韩综合一区在线观看| 精品国产_亚洲人成在线| 精品久久免费视频| 国产精品va无码免费麻豆| 男人扒开女人下添高潮日韩视频| 国产日韩一区二区三区在线观看 | 亚洲中文字幕久久精品无码APP|