智快網 - 新科技與新能源行業網絡媒體

          小米大模型團隊音頻推理突破,一周登頂MMAU榜,GRPO算法顯神威!

             發布時間:2025-03-17 20:30 作者:蘇婉清

          小米大模型團隊近日宣布,在音頻推理技術方面取得了顯著進步。該團隊受DeepSeek-R1項目的啟發,成功將強化學習算法應用于多模態音頻理解任務,這一創新實踐僅耗時一周,便在國際權威的MMAU音頻理解評測中取得了64.5%的準確率,成功登頂榜首,并且已經同步開源。

          據悉,DeepSeek-R1項目中提出的Group Relative Policy Optimization(GRPO)方法,使得模型能夠通過“試錯-獎勵”機制自主進化,展現出類似人類的反思和多步驗證等高級推理能力。小米團隊受此啟發,嘗試將GRPO算法遷移到自家的Qwen2-Audio-7B模型上,取得了令人矚目的成果。

          在訓練樣本方面,小米團隊僅使用了AVQA數據集中的3.8萬條樣本進行強化學習微調,便在MMAU評測集上實現了64.5%的準確率。這一成績不僅刷新了記錄,而且相比目前榜單上排名第一的商業閉源模型GPT-4o,有近10個百分點的優勢。

          盡管取得了如此顯著的進步,但小米團隊表示,當前模型的準確率距離人類專家的82%水平仍有差距。他們將繼續努力,不斷優化算法和模型,以期達到更高的準確率。

          在官方提供的交互demo中,小米團隊選擇了雷軍2015年“R U OK”的視頻作為默認分析對象,展示了模型在實際應用中的表現。這一選擇不僅富有趣味性,也體現了小米團隊對于用戶需求和場景理解的深入洞察。

          小米技術官微在發布這一消息時表示,音頻推理技術的突破將為智能語音助手、智能家居等領域帶來更加智能和人性化的體驗。他們期待與更多合作伙伴共同探索這一技術的廣闊應用前景。

          小米團隊還強調了開源的重要性。他們認為,通過開源可以吸引更多開發者參與到技術的創新和優化中來,共同推動人工智能技術的發展和進步。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          国模精品视频一区二区三区| 91精品国产自产在线老师啪| 亚洲第一区精品观看| 亚洲精品久久久www| 国产成人精品日本亚洲11| 精品无码国产自产拍在线观看蜜 | 亚洲精品国产精品乱码视色| 亚洲精品无码AV中文字幕电影网站| 亚洲电影日韩精品| 国产精品免费视频播放器| 少妇AV射精精品蜜桃专区| 亚洲区日韩精品中文字幕| 国内少妇偷人精品视频免费| 久久97久久97精品免视看| 国产A∨国片精品一区二区| 无码日韩精品一区二区人妻| 日韩精品一区二区三区毛片| 日韩乱码人妻无码中文字幕久久| 国产91精品久久久久久久| 国产福利视精品永久免费| 中文字幕亚洲综合精品一区| 91精品国产综合久久久久久| 国产精品小黄鸭一区二区三区| 亚洲国产精品成人AV无码久久综合影院| 日韩aⅴ人妻无码一区二区| 日韩欧美亚洲国产精品字幕久久久| 日韩精品无码免费专区午夜| 日韩人妻无码精品专区| 亚洲欧美国产日韩av野草社区| 日韩精品高清自在线| 日韩精品一区二区午夜成人版| 一本一本久久a久久精品综合麻豆| 无码人妻一区二区三区精品视频| 国产99视频精品免费视频76| 久久狠狠一本精品综合网| 久热精品视频第一页| 国产揄拍国产精品| 国产精品熟女一区二区| 久久99精品视免费看| 91精品国产免费久久国语麻豆| 亚洲欧洲国产成人精品|