智快網 - 新科技與新能源行業網絡媒體

          英偉達與MIT合作推出Audio-SDS:AI音效生成迎來參數化控制新突破

             發布時間:2025-05-13 14:29 作者:蘇婉清

          近日,科技界傳來一項新的合作成果,英偉達與麻省理工學院(MIT)攜手推出了Audio-SDS技術,這是一項基于文本條件的音頻擴散模型擴展技術,為音頻生成領域帶來了新突破。

          音頻擴散模型在近年來憑借其生成高質量音頻的能力備受矚目。然而,這類模型的一個顯著局限在于難以對明確且可解釋的參數進行優化,這限制了其在實際應用中的靈活性和廣泛性。

          為了克服這一挑戰,英偉達與MIT的科研團隊首次將Score Distillation Sampling(SDS)方法引入到音頻領域。他們結合了預訓練模型的強大生成能力與參數化音頻表示,從而無需依賴大規模特定數據集,即可應用于FM合成器參數校準、物理沖擊音合成以及音源分離等三大關鍵任務。

          SDS技術此前已在文本生成3D圖像和圖像編輯領域得到了廣泛應用。英偉達此次將SDS技術與音頻生成相結合,推出了Audio-SDS。該技術能夠利用預訓練模型的先驗知識,直接根據高級文本提示調整FM合成參數、沖擊音模擬器或分離掩碼,從而實現了更加靈活和精準的音頻生成。

          在實驗中,研究團隊采用了基于解碼器的SDS、多步去噪以及多尺度頻譜圖等方法。實驗結果表明,Audio-SDS在主觀聽覺測試和客觀指標(如CLAP分數、信號失真比SDR)上均展現出了卓越的性能。

          Audio-SDS的一大創新之處在于,它僅需一個預訓練模型即可支持多種音頻任務,從而極大地降低了對大規模領域特定數據集的依賴。這一特性使得Audio-SDS在音頻生成領域具有更廣泛的應用前景。

          然而,研究團隊也指出了Audio-SDS目前仍面臨的一些挑戰,包括模型覆蓋范圍有限、潛在編碼偽影以及優化敏感性等問題。他們表示,未來將繼續致力于解決這些問題,以進一步提升Audio-SDS的性能和應用范圍。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          无码乱码观看精品久久| 又紧又大又爽精品一区二区| 国产精品jizz视频| 成人区人妻精品一区二区不卡视频| 日韩中文字幕在线免费观看| 国产精品萌白酱在线观看| 99在线精品免费视频九九视| 久热这里只有精品视频6| 国产精品国产三级国产av品爱网 | 国产精品一区不卡| 国自产精品手机在线视频香蕉| 国产亚洲精品影视在线| 亚洲精品国产精品国自产网站 | 日韩丰满少妇无吗视频激情内射| 国产精品无码一本二本三本色| 精品无码久久久久久国产| 国产成人精品第一区二区| 精品国产一二三区在线影院| 亚洲精品亚洲人成在线麻豆| 久久精品中文闷骚内射| 久久综合日韩亚洲精品色| 国产精品久久久久jk制服| 精品国产网红福利在线观看| 欧洲精品无码一区二区三区在线播放| 精品人妻少妇一区二区| 国产精品无码素人福利不卡| 国产精品国产三级国产a| WWW国产精品内射老师| 亚洲电影日韩精品| 夜夜高潮夜夜爽国产伦精品| 午夜精品久久影院蜜桃| 亚洲国产精品狼友中文久久久| 亚洲精品tv久久久久久久久久| 亚洲精品亚洲人成在线观看下载| 日韩精品成人无码专区免费| 无码精品蜜桃一区二区三区WW| 2021国产精品自产拍在线观看| 日韩精品国产一区| 久久精品国产亚洲AV忘忧草18| 九九久久国产精品免费热6| 亚洲精品二三区伊人久久|