智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

          小米大模型團(tuán)隊(duì)突破音頻推理,強(qiáng)化學(xué)習(xí)助力登頂MMAU榜首!

             發(fā)布時(shí)間:2025-03-17 13:30 作者:唐云澤

          小米大模型團(tuán)隊(duì)在音頻推理領(lǐng)域取得了一項(xiàng)引人注目的成就。近日,該團(tuán)隊(duì)宣布,他們受Deepseek-R1的啟發(fā),在國(guó)際權(quán)威的MMAU音頻理解評(píng)測(cè)中取得了突破,以64.5%的準(zhǔn)確率登頂榜首,并且已經(jīng)將相關(guān)技術(shù)開(kāi)源。

          MMAU評(píng)測(cè)集,即大規(guī)模多任務(wù)音頻理解和推理評(píng)測(cè)集,是衡量音頻推理能力的重要標(biāo)尺。它包含了一萬(wàn)條涵蓋語(yǔ)音、環(huán)境聲和音樂(lè)的音頻樣本,并結(jié)合人類專家標(biāo)注的問(wèn)答對(duì),測(cè)試模型在27種技能上的表現(xiàn),旨在推動(dòng)模型達(dá)到接近人類專家的邏輯分析水平。然而,這一評(píng)測(cè)標(biāo)準(zhǔn)對(duì)人類來(lái)說(shuō)也并非易事,人類專家在MMAU上的準(zhǔn)確率也不過(guò)82.23%。

          在小米大模型團(tuán)隊(duì)登頂之前,MMAU官網(wǎng)榜單上的佼佼者是來(lái)自O(shè)penAI的GPT-4o,其準(zhǔn)確率為57.3%,緊隨其后的是Google DeepMind的Gemini 2.0 Flash,準(zhǔn)確率為55.6%。而來(lái)自阿里的Qwen2-Audio-7B模型,在此評(píng)測(cè)集上的表現(xiàn)則為49.2%。

          小米大模型團(tuán)隊(duì)并未止步于Qwen2-Audio-7B模型的表現(xiàn)。他們利用該模型的開(kāi)源特性,嘗試使用清華大學(xué)發(fā)布的AVQA數(shù)據(jù)集進(jìn)行微調(diào)。AVQA數(shù)據(jù)集雖然僅包含3.8萬(wàn)條訓(xùn)練樣本,但通過(guò)全量有監(jiān)督微調(diào)(SFT),Qwen2-Audio-7B模型在MMAU上的準(zhǔn)確率提升到了51.8%。這一初步成果為團(tuán)隊(duì)后續(xù)的研究奠定了堅(jiān)實(shí)的基礎(chǔ)。

          DeepSeek-R1的發(fā)布為小米大模型團(tuán)隊(duì)帶來(lái)了新的啟示。該模型采用的Group Relative Policy Optimization(GRPO)方法,使得模型能夠通過(guò)“試錯(cuò)-獎(jiǎng)勵(lì)”機(jī)制自主進(jìn)化,涌現(xiàn)出類似人類的反思和多步驗(yàn)證等推理能力。小米大模型團(tuán)隊(duì)深受啟發(fā),嘗試將DeepSeek-R1的GRPO算法遷移到Qwen2-Audio-7B模型上。

          經(jīng)過(guò)不懈的努力,小米大模型團(tuán)隊(duì)最終取得了令人矚目的成果。在僅使用AVQA的3.8萬(wàn)條訓(xùn)練樣本的情況下,強(qiáng)化學(xué)習(xí)微調(diào)后的模型在MMAU評(píng)測(cè)集上實(shí)現(xiàn)了64.5%的準(zhǔn)確率。這一成績(jī)不僅遠(yuǎn)超Qwen2-Audio-7B模型微調(diào)前的表現(xiàn),也比目前榜單上第一名的商業(yè)閉源模型GPT-4o有近10個(gè)百分點(diǎn)的優(yōu)勢(shì)。

          小米大模型團(tuán)隊(duì)的這一成就,不僅展示了他們?cè)谝纛l推理領(lǐng)域的強(qiáng)大實(shí)力,也為整個(gè)AI領(lǐng)域帶來(lái)了新的啟示。他們通過(guò)開(kāi)源技術(shù)和創(chuàng)新算法的結(jié)合,推動(dòng)了音頻理解和推理能力的提升,為未來(lái)的AI發(fā)展開(kāi)辟了新的道路。

           
           
          更多>同類內(nèi)容
          全站最新
          熱門(mén)內(nèi)容
          本欄最新
           
          智快科技微信賬號(hào)
          微信群

          微信掃一掃
          加微信拉群
          電動(dòng)汽車群
          科技數(shù)碼群

          国产精品粉嫩美女在线观看| 在线观看亚洲精品专区| 亚洲综合国产精品| 亚洲AV日韩精品一区二区三区| 久久久久久久久久久精品尤物| 精品国产免费一区二区三区香蕉 | 精品综合久久久久久98| 亚洲精品亚洲人成在线观看| 国产精品日韩专区| 日韩精品免费一线在线观看| 久久99热成人精品国产| 亚洲日韩av无码| 国产美女精品视频免费观看| 亚洲国产午夜精品理论片在线播放| 国产综合色在线精品| 久久久久久青草大香综合精品| 图片区精品综合自拍| 国产成人精品日本亚洲18图| 爱看精品福利视频观看| 国产在线无码精品电影网| 最新 国产 精品 精品 视频| 精品人妻一区二区三区浪潮在线| 中文精品人人永久免费| 国产精品久久现线拍久青草| 亚洲精品永久在线观看| 精品一区二区三区四区在线播放 | 一本大道无码日韩精品影视 | 久久精品国产大片免费观看| 日韩一二三区毛片| 精品国产av一二三四区| 成人无码精品一区二区三区| 精品videossexfreeohdbbw| 无码人妻精品内射一二三AV| 中文无码亚洲精品字幕| 人妻无码久久精品人妻 | 久久这里只精品国产99热| 日韩精品无码一区二区三区免费| 国产乱子伦精品无码专区| 亚洲日韩国产AV无码无码精品| 国产精品亚洲а∨天堂2021 | 青青青国产精品国产精品美女|