智快網 - 新科技與新能源行業網絡媒體

          Hugging Face發布超輕量級AI視覺語言模型,2.56億參數挑戰算力極限

             發布時間:2025-01-24 12:24 作者:朱天宇

          Hugging Face平臺近日宣布了一項重大進展,推出了兩款專為算力受限設備設計的輕量級AI模型——SmolVLM-256M-Instruct與SmolVLM-500M-Instruct。這兩款模型的問世,標志著在資源有限的環境下,AI性能發揮將邁入新階段。

          早在去年11月,Hugging Face就已推出了僅有20億參數的SmolVLM AI視覺語言模型,該模型因其極低的內存占用而在同類產品中表現突出,特別適用于設備端推理。而此次推出的新版本,則在參數數量上進行了進一步優化。

          SmolVLM-256M-Instruct,作為目前發布的最小視覺語言模型,其參數量僅為2.56億。令人驚嘆的是,這款模型甚至能在內存低于1GB的PC上流暢運行,同時提供出色的性能表現。這無疑為那些擁有有限硬件資源的用戶和開發者打開了全新的可能性。

          另一款模型SmolVLM-500M-Instruct,則擁有5億參數。它主要針對硬件資源受限的場景設計,旨在幫助開發者應對大規模數據分析的挑戰,實現AI處理效率和可訪問性的雙重突破。這兩款模型的推出,無疑將進一步提升Hugging Face在AI領域的競爭力。

          SmolVLM系列模型具備先進的多模態能力,能夠執行包括圖像描述、短視頻分析以及回答關于PDF或科學圖表問題在內的多項任務。Hugging Face解釋稱,SmolVLM在構建可搜索數據庫時速度更快、成本更低,其性能甚至可媲美規模遠超其自身的模型。

          為了開發這些模型,Hugging Face采用了兩個專有數據集:The Cauldron和Docmatix。The Cauldron是一個包含50個高質量圖像和文本數據集的精選集合,專注于多模態學習。而Docmatix則專為文檔理解而設計,通過將掃描文件與詳細標題配對,以增強模型的理解能力。

          在模型架構方面,SmolVLM-256M-Instruct和SmolVLM-500M-Instruct采用了更小的視覺編碼器SigLIP base patch-16/512,而非SmolVLM 2B中使用的更大版本SigLIP 400M SO。這一優化減少了冗余,提高了模型處理復雜數據的能力,并優化了圖像標記的處理方式。

          SmolVLM系列模型能夠以每個標記4096像素的速率對圖像進行編碼,這一性能相較于早期版本中的每標記1820像素有了顯著提升。這一改進將進一步增強模型在圖像處理和理解方面的能力。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          日韩经典午夜福利发布| 嫩草影院在线观看精品视频| 久久精品国产99国产精品| 日韩视频一区二区三区| 国产精品福利一区| 亚洲日韩区在线电影| 国产SUV精品一区二区四| 国产精品久久波多野结衣| 精品久久人人爽天天玩人人妻| 亚洲精品国产精品国自产观看| 亚洲国产精品久久久久秋霞影院| 国产精品久久久久久久久久久搜索 | 久久亚洲日韩精品一区二区三区| 精品久久久久久中文字幕女| 久久精品视频99精品视频150| 日韩黄a级成人毛片| 精品一区二区三区四区在线播放| 国产亚洲精品高清在线| 国产高清精品在线| 四虎国产精品永久地址入口| 中文字幕无码日韩专区| 日韩美女18网站久久精品| 国产精品久久现线拍久青草| 国产成人精品久久亚洲高清不卡 | 538精品视频在线观看mp4| 久久av老司机精品网站导航| 国产精品区一区二区三在线播放| 国模精品一区二区三区视频| 香蕉视频国产精品| 国产精品国产三级专区第1集| 久久精品人人爽人人爽| 国产成人精品高清在线观看93 | 亚洲AⅤ永久无码精品AA| 久久精品无码一区二区WWW| 久久久精品一区二区三区| 亚洲精品美女久久久久99| 国产日韩精品中文字无码 | 国内精品久久久人妻中文字幕| 精品3d动漫视频一区在线观看| 精品国产一区二区三区久| 国产精品久久久久久久|