智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

          Meta新推Llama 3.2量化版,1B/3B模型功耗再降低!

             發(fā)布時間:2024-10-27 15:15 作者:陸辰風(fēng)

          meta公司近日宣布,繼9月推出Llama 3.2的1B與3B模型后,他們于10月24日發(fā)布了這兩個模型的量化版本。通過量化,模型大小平均縮減了56%,RAM使用量降低了41%,并且模型運行速度提升了2至4倍,功耗也有所下降,這使得模型更易于部署在移動設(shè)備上。

          meta采用了兩種量化方法:量化感知訓(xùn)練(QAT)和后訓(xùn)練量化(SpinQuant)。前者注重模型的準確性,后者則強調(diào)模型的可移植性。

          針對Llama 3.2的1B和3B模型,meta分別推出了兩款量化版本。這些量化模型相較于非量化的Llama BF16模型,速度更快,RAM占用更少,功耗更低,同時保持了與Llama BF16版本相近的精度。

          盡管量化后的模型支持的Token上下文有所減少,但meta的測試顯示,量化版本的基準測試結(jié)果與原版相差無幾。

          meta已在一加12、三星S24+/S22及蘋果iOS設(shè)備等移動平臺上測試了這些量化模型,并計劃未來通過神經(jīng)處理單元(NPU)進一步提升模型性能。

           
           
          更多>同類內(nèi)容
          全站最新
          熱門內(nèi)容
          本欄最新
           
          智快科技微信賬號
          ITBear微信賬號

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數(shù)碼群

          一级A毛片免费观看久久精品| 国产精品久久久久久久久软件 | 国产区香蕉精品系列在线观看不卡| 2021国产精品午夜久久| 99久久国产综合精品1尤物| 久久99国产精品久久| 国产日韩精品一区二区三区在线| 国产精品污WWW一区二区三区 | 91精品在线播放| 国产成人亚洲精品91专区手机| 日韩人妻系列无码专区| 日韩人妻精品一区二区三区视频| 国产三级久久精品三级| 国产成人福利精品视频| 日韩精品人妻系列无码av东京| 成人精品一区二区三区校园激情 | 国产精品无码久久综合网| 精品久久久一二三区| 99精品国产在热久久无毒不卡| 精品无码成人片一区二区98 | 国产精品va在线观看一| 国产在线观看91精品不卡| 国产精品亚洲一区二区三区在线观看| 精品久久久久久亚洲综合网| 国产精品一区二区毛卡片| 国产欧美精品123区发布| 在线播放精品一区二区啪视频| 精品久久久久久中文字幕无码 | 国产精品嫩草影院久久| 亚洲精品美女久久久久99小说| 西瓜精品国产自在现线| 国产高清在线精品一本大道国产| 国产精品玖玖美女张开腿让男人桶爽免费看 | 欧美亚洲精品一区二区| 精品人妻少妇一区二区三区不卡| 精品一区二区三人妻视频| 狠狠久久精品中文字幕无码| 国产精品电影一区二区三区| 日韩人妻激情制服丝袜另类| 日韩在线永久免费播放| 在线视频日韩精品|