智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

          Hugging Face發(fā)布SmolVLM系列:小巧而強(qiáng)大的視覺語言模型登場

             發(fā)布時(shí)間:2025-01-26 20:38 作者:楊凌霄

          近日,Hugging Face 推出了兩款創(chuàng)新的多模態(tài)模型——SmolVLM-256M和SmolVLM-500M,這兩款模型在視覺與語言處理領(lǐng)域引起了廣泛關(guān)注。其中,SmolVLM-256M更是被譽(yù)為全球最小的視覺語言模型,這一突破性的成就令人矚目。

          據(jù)了解,這兩款模型均源自Hugging Face團(tuán)隊(duì)去年訓(xùn)練的龐大800億參數(shù)模型,通過精心的蒸餾技術(shù)提煉而成。它們成功地在高性能與資源效率之間找到了完美的平衡點(diǎn)。官方強(qiáng)調(diào),無論是SmolVLM-256M還是SmolVLM-500M,都無需復(fù)雜配置,即可“即插即用”,輕松部署在transformer MLX和ONNX平臺(tái)上。

          從技術(shù)細(xì)節(jié)來看,SmolVLM-256M和SmolVLM-500M均采用了SigLIP作為圖像編碼器,而文本編碼任務(wù)則交由SmolLM2完成。SmolVLM-256M以其小巧的體積脫穎而出,成為目前最小的多模態(tài)模型。它能夠接收任意序列的圖像和文本輸入,并生成相應(yīng)的文字輸出,功能涵蓋圖像描述、視頻字幕生成、PDF處理等。尤為該模型體積小巧,即便在移動(dòng)平臺(tái)上也能流暢運(yùn)行,僅需不到1GB的GPU顯存即可完成單張圖像的推理任務(wù)。

          相比之下,SmolVLM-500M則針對高性能需求進(jìn)行了優(yōu)化。Hugging Face表示,這款模型非常適合企業(yè)運(yùn)營環(huán)境,盡管其資源需求略高于SmolVLM-256M,但在推理輸出的精準(zhǔn)度上有了顯著提升。具體來說,SmolVLM-500M在處理單張圖像時(shí),僅需1.23GB的GPU顯存。

          這兩款模型均遵循Apache 2.0開源協(xié)議,研究團(tuán)隊(duì)還提供了基于transformer和WebGUI的示例程序,以便開發(fā)者快速上手。目前,所有模型及其演示均已公開發(fā)布,開發(fā)者可以輕松下載并使用,具體訪問頁面請點(diǎn)擊此處。

           
           
          更多>同類內(nèi)容
          全站最新
          熱門內(nèi)容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動(dòng)汽車群
          科技數(shù)碼群

          久久精品国产亚洲一区二区| 亚洲日韩国产精品乱| 三级精品在线观看| 99在线精品国自产拍中文字幕 | 日韩亚洲Av人人夜夜澡人人爽| 精品久久久久久中文字幕无码| 91国内揄拍国内精品情侣对白 | 亚洲精品欧美综合四区| 99re热久久精品这里都是精品| 久久国产精品99久久久久久牛牛| 国内精品视频在线观看| 日本三区精品三级在线电影| 国产精品成人久久久久三级午夜电影 | 亚洲精品高清国产一久久| 日韩a级毛片免费观看| 国产精品酒店视频| 国产精品一区二区毛卡片| 国产精品福利一区二区| 日韩激情无码免费毛片| 亚洲性日韩精品一区二区三区| 国产精品亚洲色图| 成人精品一区久久久久| 精品久久精品久久| 四虎国产成人永久精品免费| 久久精品国产亚洲网站| 国产精品揄拍100视频| 亚洲日韩中文字幕无码一区| 国产在线精品99一卡2卡| 亚洲av午夜国产精品无码中文字 | 国产精品无码久久四虎| 色欲AV永久无码精品无码| 亚洲熟女精品中文字幕| 亚洲乱码日产精品一二三| 亚洲AV永久无码精品放毛片| 日产精品卡一卡二卡三的概述| 久久精品人人做人人爱爱| 国语自产偷拍精品视频偷| 精品久久久久久中文| 国产成人亚洲精品播放器下载| 6080日韩午夜伦伦午夜伦| 日韩不卡视频在线|