智快網 - 新科技與新能源行業網絡媒體

          Hugging Face新推SmolVLM AI模型,20億參數助力設備端高效推理

             發布時間:2024-11-27 14:18 作者:蘇婉清

          Hugging Face平臺近期在科技界掀起波瀾,發布了一款名為SmolVLM的AI視覺語言模型(VLM),這款模型以其精簡的20億參數設計,專為設備端推理打造,憑借超低的內存占用,在眾多同類模型中獨樹一幟。

          SmolVLM AI模型的核心優勢在于其小巧的體積、驚人的處理速度以及高效的內存利用。更重要的是,該模型完全開源,所有相關的模型檢查點、VLM數據集、訓練配方和工具,均在Apache 2.0許可證下向公眾開放。

          SmolVLM提供了三個版本以滿足不同需求:SmolVLM-Base,適用于下游任務的微調;SmolVLM-Synthetic,基于合成數據進行微調;以及SmolVLM-Instruct,這是一個指令微調版本,可直接應用于交互式應用中。

          該模型在架構設計上的巧妙之處,是其借鑒了Idefics3的理念,并采用了SmolLM2 1.7B作為語言主干。通過創新的像素混洗策略,SmolVLM將視覺信息的壓縮率提升了9倍,從而實現了更高效的視覺信息處理。

          在訓練數據集方面,SmolVLM涵蓋了Cauldron和Docmatix,并對SmolLM2進行了上下文擴展,使其能夠處理更長的文本序列和多張圖像。這一優化不僅提升了模型的性能,還有效降低了內存占用,解決了大型模型在普通設備上運行緩慢甚至無法運行的問題。

          在內存使用方面,SmolVLM展現出了卓越的能力。它將384x384像素的圖像塊編碼為81個tokens,這意味著在相同的測試圖片下,SmolVLM僅需使用1200個tokens,而相比之下,Qwen2-VL則需要1.6萬個tokens。這一顯著的內存節省,使得SmolVLM在設備端推理上更具優勢。

          在性能表現上,SmolVLM同樣令人矚目。它在多個基準測試中,如MMMU、MathVista、MMStar、DocVQA和TextVQA等,均展現出了出色的處理能力。與Qwen2-VL相比,SmolVLM在預填充吞吐量上快了3.3到4.5倍,而在生成吞吐量上更是快了7.5到16倍。

          這款創新模型的發布,無疑為AI視覺語言模型領域帶來了新的活力和可能性。隨著SmolVLM的廣泛應用和深入發展,我們有理由期待它在未來能夠發揮更大的作用,為人工智能技術的發展貢獻更多的力量。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          亚洲中文字幕久久精品无码2021| 久久机热这里只有精品无需| 在线精品国产一区二区| 国产精品美女久久久网站动漫| 久久99青青精品免费观看| 日韩美香港a一级毛片| 国产精品麻花传媒二三区别| 91精品国产高清91久久久久久| 免费a级毛片18以上观看精品| 国产日产欧产精品精品浪潮| 国产精品入口在线看麻豆| 亚洲国产精品白丝在线观看| 99视频精品全部在线| 久久国产精品张柏芝| 日韩精品国产自在久久现线拍| 精品乱码久久久久久中文字幕 | 日韩欧美群交P内射捆绑| 成人综合久久精品色婷婷| 欧产日产国产精品精品| 国精品无码一区二区三区在线 | 亚洲精品福利网站| 亚洲精品福利网站| 精品久久人妻av中文字幕| 精品无码AV一区二区三区不卡| 亚洲AV日韩精品久久久久| 久久99国产精品一区二区| 99久久精品国内| 国产福利精品在线观看| 国产精品不卡高清在线观看| 精品福利视频导航| 国产私拍福利精品视频网站| 国产精品久久久久久搜索| 精品亚洲aⅴ在线观看| 亚洲国产精品综合久久网络| 日韩av激情在线观看| 国产精品二区高清在线| 一本色道久久88亚洲精品综合 | 国产精品资源在线观看网站| 国产精品无码免费播放| 精品人妻中文av一区二区三区| 99久久精品国产免费|