智快網 - 新科技與新能源行業網絡媒體

          昆侖萬維引領科技前沿,開源R1V多模態視覺思維鏈推理模型

             發布時間:2025-03-18 17:23 作者:顧雨柔

          昆侖萬維近日宣布了一項重大技術突破,正式向公眾開源了其自主研發的多模態思維鏈推理模型Skywork R1V。此舉標志著昆侖萬維成為中國首個在多模態推理模型領域進行開源的企業,同時開放了模型的權重和技術報告,供業界研究與使用。

          Skywork R1V模型的權重可通過Hugging Face和GitHub兩大平臺下載,分別對應的鏈接為:https://huggingface.co/Skywork/Skywork-R1V-38B和https://github.com/SkyworkAI/Skywork-R1V。

          據了解,Skywork R1V是一款專注于解決復雜視覺任務的推理模型,它通過多步邏輯推理與分析,能夠精準解決視覺邏輯推理、視覺數學問題、科學現象分析以及醫學影像診斷等多種挑戰。在MATH500和AIME兩項權威基準測試中,Skywork R1V分別取得了94.0和72.0的高分,展現出強大的邏輯推理與數學分析能力。

          在視覺理解能力方面,Skywork R1V同樣表現出色。通過將文本推理與思維鏈推導能力遷移到視覺任務中,該模型在MMMU和MathVista兩項視覺推理基準測試中分別獲得了69和67.5分的優異成績。這些成就不僅證明了Skywork R1V在跨模態任務中的高效融合能力,也彰顯了其在復雜多模態任務中的卓越表現。

          昆侖萬維團隊在Skywork R1V模型中引入了三項關鍵技術創新。首先,他們首次提出了利用Skywork-VL的視覺投影器,實現了文本推理能力向視覺任務的高效遷移,同時保留了模型原本的優秀文本推理能力。這一創新無需重新訓練語言模型和視覺編碼器,大大提升了遷移效率和效果。

          其次,團隊采用了多模態混合式訓練策略(Iterative SFT+GRPO),通過結合迭代監督微調與GRPO強化學習,分階段對齊視覺-文本表征,實現了跨模態任務的高效融合。這一策略不僅提升了模型在MMMU和MathVista等基準測試中的表現,還與更大規模的閉源模型基本持平。通過反復迭代地利用高質量數據與高難度數據的組合,模型的知識鞏固與錯誤糾正能力得到了顯著提升。

          最后,團隊還提出了一種基于視覺-文本復雜度的自適應推理鏈長度控制機制。這一機制能夠動態優化模型的推理過程,避免“過度思考”,從而提升推理效率。結合多階段自蒸餾策略,進一步提升了數據生成與推理過程的質量,促進了模型在復雜多模態任務中的表現。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          久久久久成人精品无码| 日韩不卡中文字幕| 亚洲国产精品综合一区在线| 亚洲处破女AV日韩精品| 久久久这里有精品中文字幕| jizzjizz国产精品久久| 日韩精品一区二区三区国语自制| 国产69久久精品成人看小说| 国产精品自在在线午夜出白浆| 97色精品视频在线观看| 亚洲精品无码久久久久久| 国产日韩精品在线| 国产精品久久永久免费| 中文字幕一区二区精品区| 四虎国产精品永久在线观看| 久久精品国产这里是免费| 国产精品区免费视频| 亚洲av无码国产精品夜色午夜| 国产精品禁18久久久夂久| 国内精品久久久人妻中文字幕| 中文字幕在线亚洲精品| 2022国产成人精品视频人 | 久久精品中文騷妇女内射| 久9热免费精品视频在线观看| 久热re这里只有精品视频| 精品一区二区三区四区| 日韩精品在线一区二区| 亚洲高清专区日韩精品 | 国产精品高清久久久久久久| 日韩精品电影在线观看| 国产精品久久久久国产精品| 国产精品久久久久999| 日韩一级片免费观看| 中文字幕日韩丝袜一区| 日韩在线看片免费人成视频播放| 无码AV动漫精品一区二区免费| 日韩一区二区三区在线 | 精品国产sm捆绑最大网免费站| 91亚洲精品麻豆| 国产精品久久新婚兰兰| 亚洲av日韩精品久久久久久a |