智快網 - 新科技與新能源行業網絡媒體

          騰訊AI新突破:無監督前綴微調技術大幅降低推理計算成本

             發布時間:2025-03-02 15:51 作者:陸辰風

          近日,科技界傳來一則新進展,騰訊AI Lab與香港中文大學攜手,在大型語言模型推理效率方面取得了突破。他們提出了一項名為“無監督前綴微調”(UPFT)的創新技術,為提升語言模型的推理能力提供了新的思路。

          UPFT技術的核心在于,它并不需要對整個推理過程進行全面處理,而是聚焦于模型輸出的前幾個詞元(token),具體而言,是前8至32個詞元。這一方法巧妙地捕捉到了不同推理路徑中的共同早期關鍵步驟,從而在減少計算開銷的同時,實現了推理性能的提升。這一發現無疑為大型語言模型的優化帶來了新的曙光。

          眾所周知,大型語言模型在語言理解和生成方面已經展現出了強大的能力,但在推理方面仍有待提升。傳統的微調方法往往需要依賴大量的標注數據或復雜的拒絕采樣技術,這無疑增加了資源消耗的難度。而UPFT則打破了這一局限,它通過關注模型輸出的初始詞元,有效地解決了效率和對昂貴監督的依賴問題。

          研究發現,對于同一個問題,模型生成的各種推理路徑的初始步驟往往具有很高的相似性。UPFT正是基于這種“前綴自洽性”原理,無需完整的推理軌跡或大量的標注數據,僅通過這些初始標記進行訓練,便能夠取得顯著的效果。

          UPFT技術還巧妙地融合了貝葉斯推理原理,將正確推理的概率分解為“覆蓋率”和“準確性”兩部分。通過訓練早期詞元,UPFT在探索多樣化的推理路徑的同時,確保了結果的可靠性。實驗數據表明,UPFT技術能夠顯著減少訓練中處理的詞元數量,最高可達95%,并大幅降低時間和內存需求。

          在GSM8K、MATH500、AIME2024和GPQA等推理基準測試中,UPFT展現出了卓越的性能。特別是在Qwen2.5-Math-7B-Instruct模型上,UPFT在減少訓練和推理詞元數量的同時,還提升了平均準確率。在復雜推理任務中,UPFT的性能提升尤為明顯,這進一步證明了早期推理步驟中蘊含著解決問題的關鍵信息。

          這一創新成果不僅為大型語言模型的優化提供了新的方向,也為人工智能領域的未來發展注入了新的活力。我們有理由相信,隨著技術的不斷進步和創新,人工智能將在更多領域展現出更加廣泛的應用前景。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          久久99国产精品99久久| 8x福利精品第一导航| 98色精品视频在线| 91精品一区二区| 久久久精品人妻一区二区三区 | 精品一区二区三区视频| 日韩国产一区二区| 国产精品自拍亚洲| 另类ts人妖精品影院| 国产精品自在线拍国产手机版| 久久久国产亚洲精品| 国产精品久久免费| 精品国产乱子伦一区二区三区| 69国产成人综合久久精品91| 无码人妻精品一区二区三区66 | 久久99精品久久久| 国产成人精品无码免费看| 亚洲精品无码高潮喷水在线| 久久亚洲中文字幕精品一区四| 国产精品美女久久久免费| 一级一级特黄女人精品毛片| 色精品一区二区三区| 日韩AV高清在线看片| 精品视频一区二区观看| 成人国内精品久久久久影院| 日韩一区在线视频| 日本精品一区二区三区在线视频 | 久久国产精品二国产精品| 国产精品乱码一区二区三区| 国产精品久久久99| 香蕉伊思人在线精品| 91麻豆精品国产| 亚洲精品无码久久久久去q | 亚洲综合久久精品无码色欲| 九九精品免费视频| 久久久国产精品va麻豆| 国模吧一区二区三区精品视频| 日韩精品一区在线| 国产午夜亚洲精品不卡免下载| 八区精品色欲人妻综合网| 日韩色图在线观看|