智快網 - 新科技與新能源行業網絡媒體

          中國電信TeleAI-t1-preview發布,邏輯推理能力超OpenAI標桿模型

             發布時間:2025-01-25 18:31 作者:沈瑾瑜

          中國電信人工智能研究院近日宣布,其傾力打造的“復雜推理大模型”TeleAI-t1-preview已正式面世,并將很快在天翼AI開放平臺上與公眾見面。該模型采用先進的強化學習訓練技術,通過引入探索與反思機制,顯著提升了在邏輯推理與數學推導等復雜問題上的解答精度。

          據官方介紹,TeleAI-t1-preview在美國數學競賽AIME 2024與MATH500兩項權威基準測試中,分別以60分和93.8分的優異成績,遠超OpenAI的o1-preview和GPT-4o等業界標桿模型。在研究生級別問答測試GPQA Diamond中,其表現同樣出色,得分超越GPT-4o,與Claude 3.5 Sonnet的性能不相上下。

          評測顯示,TeleAI-t1-preview在處理《九章算術》中的題目時,能夠先對文言文進行精準理解和簡化,再轉換成現代漢語,并給出詳細的數學推導過程和答案。這一過程中,模型展現了將形象思維與抽象思維相結合的能力,對所涉及場景進行具象化思考,從而更好地理解題目。

          尤為TeleAI-t1-preview還能嚴謹地進行古今單位換算,確保了答案的準確性。這一成就得益于中國電信人工智能研究院在模型訓練策略上的創新。

          在數據準備階段,研究院收集并構建了一個以數學為核心、涵蓋多學科的高質量推理數據集,為模型適應不同類型推理任務打下了堅實基礎。還訓練了一個專門的Judge Model,用于分析和評估模型長思考鏈路的正確性,為模型的反思和錯誤修正提供精準指導。

          在監督微調(SFT)階段,研究院采用蒙特卡洛樹搜索(MCTS)構造高質量長推理數據,結合每個步驟的準確率和解決方案長度,選擇最優完整路徑。這不僅保證了推理答案的準確性,還有效拉長了思考鏈路,使推理過程更加細粒度。同時,利用Judge Model對推理過程中正確率較低的路徑進行分析,引導模型對錯誤推理步驟進行反思和修正,從而構造出高質量的思維鏈數據進行SFT訓練。

          在強化學習階段,研究院額外構造了基于規則的獎勵模型(Rule-based Reward Model),提供準確獎勵信號,通過在線強化學習算法進一步提升模型的邏輯推理能力。這一系列創新舉措,共同成就了TeleAI-t1-preview在復雜推理領域的卓越表現。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          久久99精品久久久久子伦小说| 99精品视频在线观看免费| 日韩AV东京社区男人的天堂| 国产精品视频一区二区三区| 亚洲精品视频在线| 久久国产精品视频一区| 亚洲精品你懂的在线观看 | 黑人巨大精品播放| 日韩在线观看视频黄| 国产精品萌白酱在线观看| 无码人妻精品一区二区三区不卡| 无码精品尤物一区二区三区| 亚洲精品国产福利片| 亚洲国产精品线在线观看| 亚洲AV永久无码精品成人| 国产三级精品三级在线专区1| 中文字幕无码精品亚洲资源网 | 国内精品51视频在线观看| 久久精品国产72国产精福利| xxx国产精品视频| 国产精品麻豆VA在线播放| 一级做a爰黑人又硬又粗免费看51社区国产精品视 | 2022国产成人精品视频人| 久久er国产精品免费观看8| 国产精品国产三级在线专区| 亚洲一级Av无码毛片久久精品| 亚洲国产精品国产自在在线| 亚洲精品高清一二区久久| japanese乱人伦精品| 凹凸国产熟女精品视频app| 国产精品片在线观看手机版 | 91亚洲精品第一综合不卡播放| 久久精品人人做人人爽电影蜜月| 99国产精品热久久久久久夜夜嗨| 久久久无码精品亚洲日韩蜜臀浪潮| 日韩人妻精品无码一区二区三区| 99re6在线视频精品免费下载| 久久精品国产网红主播| 亚洲国产精品久久丫| 色花堂国产精品第一页| 亚洲中文字幕久久精品无码VA |