智快網 - 新科技與新能源行業網絡媒體

          Hugging Face發布超輕量級AI視覺語言模型,2.56億參數挑戰算力極限

             發布時間:2025-01-24 12:24 作者:朱天宇

          Hugging Face平臺近日宣布了一項重大進展,推出了兩款專為算力受限設備設計的輕量級AI模型——SmolVLM-256M-Instruct與SmolVLM-500M-Instruct。這兩款模型的問世,標志著在資源有限的環境下,AI性能發揮將邁入新階段。

          早在去年11月,Hugging Face就已推出了僅有20億參數的SmolVLM AI視覺語言模型,該模型因其極低的內存占用而在同類產品中表現突出,特別適用于設備端推理。而此次推出的新版本,則在參數數量上進行了進一步優化。

          SmolVLM-256M-Instruct,作為目前發布的最小視覺語言模型,其參數量僅為2.56億。令人驚嘆的是,這款模型甚至能在內存低于1GB的PC上流暢運行,同時提供出色的性能表現。這無疑為那些擁有有限硬件資源的用戶和開發者打開了全新的可能性。

          另一款模型SmolVLM-500M-Instruct,則擁有5億參數。它主要針對硬件資源受限的場景設計,旨在幫助開發者應對大規模數據分析的挑戰,實現AI處理效率和可訪問性的雙重突破。這兩款模型的推出,無疑將進一步提升Hugging Face在AI領域的競爭力。

          SmolVLM系列模型具備先進的多模態能力,能夠執行包括圖像描述、短視頻分析以及回答關于PDF或科學圖表問題在內的多項任務。Hugging Face解釋稱,SmolVLM在構建可搜索數據庫時速度更快、成本更低,其性能甚至可媲美規模遠超其自身的模型。

          為了開發這些模型,Hugging Face采用了兩個專有數據集:The Cauldron和Docmatix。The Cauldron是一個包含50個高質量圖像和文本數據集的精選集合,專注于多模態學習。而Docmatix則專為文檔理解而設計,通過將掃描文件與詳細標題配對,以增強模型的理解能力。

          在模型架構方面,SmolVLM-256M-Instruct和SmolVLM-500M-Instruct采用了更小的視覺編碼器SigLIP base patch-16/512,而非SmolVLM 2B中使用的更大版本SigLIP 400M SO。這一優化減少了冗余,提高了模型處理復雜數據的能力,并優化了圖像標記的處理方式。

          SmolVLM系列模型能夠以每個標記4096像素的速率對圖像進行編碼,這一性能相較于早期版本中的每標記1820像素有了顯著提升。這一改進將進一步增強模型在圖像處理和理解方面的能力。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          99精品在线视频| 国产成人精品一区二区三区无码 | 无码精品人妻一区二区三区中| 国产精品99久久精品爆乳| 日韩精品无码专区免费播放| 国产精品高清在线观看93| 精品久久无码中文字幕| 99久久综合精品国产| 久久精品午夜福利| 国产亚洲一区二区精品| 国内精品视频九九九九| 精品国内自产拍在线观看| 西瓜精品国产自在现线| 亚洲日韩一区精品射精| 国产精品亚洲精品日韩已方| 国产精品亚洲小说专区| 日韩精品一区在线| 精品伊人久久大香线蕉网站| 99er热精品视频| 国产精品久久久久久久久久久不卡 | 亚洲国产精品线观看不卡| 亚洲第一精品在线视频| 亚洲av无码国产精品夜色午夜| 久久久久久久99精品免费观看| 亚洲精品成人片在线观看精品字幕| 久夜色精品国产一区二区三区| 国产精品高清在线观看| 亚洲精品无码久久毛片| 亚洲精品麻豆av| 国产成人AV无码精品| 国产精品igao视频| 国产精品黄页免费高清在线观看| 国产精品hd免费观看| 国产精品自在拍一区二区不卡 | 一区二区精品久久| 亚州日韩精品专区久久久| 亚洲国产精品激情在线观看| 51午夜精品免费视频| 国产日韩久久久精品影院首页| 久久精品国产72国产精福利| 国产午夜精品久久久久九九电影|