智快網 - 新科技與新能源行業網絡媒體

          小米大模型團隊音頻推理突破,一周登頂MMAU榜,GRPO算法顯神威!

             發布時間:2025-03-17 20:30 作者:蘇婉清

          小米大模型團隊近日宣布,在音頻推理技術方面取得了顯著進步。該團隊受DeepSeek-R1項目的啟發,成功將強化學習算法應用于多模態音頻理解任務,這一創新實踐僅耗時一周,便在國際權威的MMAU音頻理解評測中取得了64.5%的準確率,成功登頂榜首,并且已經同步開源。

          據悉,DeepSeek-R1項目中提出的Group Relative Policy Optimization(GRPO)方法,使得模型能夠通過“試錯-獎勵”機制自主進化,展現出類似人類的反思和多步驗證等高級推理能力。小米團隊受此啟發,嘗試將GRPO算法遷移到自家的Qwen2-Audio-7B模型上,取得了令人矚目的成果。

          在訓練樣本方面,小米團隊僅使用了AVQA數據集中的3.8萬條樣本進行強化學習微調,便在MMAU評測集上實現了64.5%的準確率。這一成績不僅刷新了記錄,而且相比目前榜單上排名第一的商業閉源模型GPT-4o,有近10個百分點的優勢。

          盡管取得了如此顯著的進步,但小米團隊表示,當前模型的準確率距離人類專家的82%水平仍有差距。他們將繼續努力,不斷優化算法和模型,以期達到更高的準確率。

          在官方提供的交互demo中,小米團隊選擇了雷軍2015年“R U OK”的視頻作為默認分析對象,展示了模型在實際應用中的表現。這一選擇不僅富有趣味性,也體現了小米團隊對于用戶需求和場景理解的深入洞察。

          小米技術官微在發布這一消息時表示,音頻推理技術的突破將為智能語音助手、智能家居等領域帶來更加智能和人性化的體驗。他們期待與更多合作伙伴共同探索這一技術的廣闊應用前景。

          小米團隊還強調了開源的重要性。他們認為,通過開源可以吸引更多開發者參與到技術的創新和優化中來,共同推動人工智能技術的發展和進步。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          亚洲欧美日韩国产精品一区| 久久丫精品国产亚洲av| 亚洲毛片基地日韩毛片基地| 精品无码专区亚洲| 精品国际久久久久999波多野| 无码精品人妻一区二区三区中| 日韩精品无码免费专区网站| 国产AV国片精品一区二区 | 精品久人妻去按摩店被黑人按中出| 日韩美女在线观看一区| 精品日韩在线视频一区二区三区| 日韩精品无码人妻免费视频| 国产日产欧产精品精品浪潮| 精品少妇人妻AV一区二区| 亚洲国产精品日韩av不卡在线| 国产精品手机在线| 国产成人精品亚洲日本在线| 亚洲国产精品张柏芝在线观看| 97福利视频精品第一导航| 99视频精品全国在线观看| 无码精品久久久久久人妻中字| 国产国产精品人在线观看| 国产午夜精品视频| 九九热在线视频观看这里只有精品| 91麻豆精品国产| 中文精品人人永久免费| 窝窝午夜看片国产精品人体宴| 中文国产成人精品久久app| 91精品国产福利尤物| 国产在线精品一区免费香蕉| 99精品久久精品一区二区| 人妻少妇精品一区二区三区| 亚洲精品无码久久一线| 精品久久久久久国产| 国产a∨精品一区二区三区不卡| 久久精品国产只有精品2020| 久久精品国产精品亚洲精品| 午夜精品乱人伦小说区| 久久精品人人做人人爽97| 亚洲欧洲国产精品久久| 精品福利视频一区二区三区|