智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

          英偉達(dá)Blackwell DGX系統(tǒng)刷新DeepSeek推理性能世界紀(jì)錄

             發(fā)布時(shí)間:2025-03-19 08:53 作者:沈瑾瑜

          英偉達(dá)在NVIDIA GTC 2025大會(huì)上宣布,其最新推出的NVIDIA Blackwell DGX系統(tǒng)在DeepSeek-R1大模型推理性能上創(chuàng)造了世界紀(jì)錄。這一突破性進(jìn)展標(biāo)志著英偉達(dá)在人工智能推理技術(shù)上的又一次飛躍。

          據(jù)悉,在單個(gè)搭載八塊Blackwell GPU的DGX系統(tǒng)上,DeepSeek-R1模型以6710億參數(shù)的滿血狀態(tài)運(yùn)行,實(shí)現(xiàn)了每用戶每秒超過(guò)250 token的響應(yīng)速度,系統(tǒng)整體吞吐量更是突破了每秒3萬(wàn)token的大關(guān)。這一數(shù)據(jù)不僅彰顯了Blackwell GPU的強(qiáng)大性能,也展示了英偉達(dá)在優(yōu)化大型語(yǔ)言模型推理方面的深厚實(shí)力。

          英偉達(dá)強(qiáng)調(diào),隨著B(niǎo)lackwell Ultra GPU和Blackwell GPU的不斷升級(jí),NVIDIA平臺(tái)將繼續(xù)在推理性能上實(shí)現(xiàn)新的突破。這一承諾不僅體現(xiàn)在硬件上,還體現(xiàn)在軟件優(yōu)化上。英偉達(dá)通過(guò)結(jié)合硬件和軟件的力量,自2025年1月以來(lái),成功將DeepSeek-R1 671B模型的吞吐量提高了約36倍。

          在會(huì)上,英偉達(dá)還展示了不同配置下的DGX系統(tǒng)性能。包括DGX B200(8塊GPU)和DGX H200(8塊GPU)在內(nèi)的單節(jié)點(diǎn)配置,在采用TensorRT-LLM軟件的最新內(nèi)部版本進(jìn)行測(cè)試時(shí),展現(xiàn)了出色的推理性能。測(cè)試參數(shù)包括輸入1024 token和輸出2048 token,并發(fā)性達(dá)到最大。在計(jì)算精度上,B200采用了FP4精度,而H200則采用了FP8精度。

          英偉達(dá)還對(duì)比了Blackwell架構(gòu)與Hopper架構(gòu)在推理性能上的差異。結(jié)果顯示,Blackwell架構(gòu)與TensorRT軟件相結(jié)合,可以顯著提升推理性能。在DeepSeek-R1、Llama 3.1 405B和Llama 3.3 70B等模型上,使用FP4精度的DGX B200平臺(tái)和DGX H200平臺(tái)相比,推理吞吐量提高了3倍以上。

          英偉達(dá)還展示了不同數(shù)據(jù)集上DeepSeek-R1模型的精度表現(xiàn)。在FP4和FP8精度下,DeepSeek-R1模型在MMLUG、SM8K、AIME 2024、GPQA和DiamondMATH-500等數(shù)據(jù)集上的表現(xiàn)均十分出色。值得注意的是,在使用TensorRT Model Optimizer的FP4訓(xùn)練后量化(PTQ)技術(shù)時(shí),DeepSeek-R1模型在不同數(shù)據(jù)集上的精度損失微乎其微,這進(jìn)一步證明了英偉達(dá)在量化技術(shù)上的領(lǐng)先地位。

          英偉達(dá)表示,在對(duì)模型進(jìn)行量化以利用低精度計(jì)算優(yōu)勢(shì)時(shí),確保精度損失最小化是生產(chǎn)部署的關(guān)鍵。通過(guò)不斷的技術(shù)創(chuàng)新和優(yōu)化,英偉達(dá)將繼續(xù)為客戶提供更高效、更準(zhǔn)確的AI推理解決方案。

           
           
          更多>同類內(nèi)容
          全站最新
          熱門內(nèi)容
          本欄最新
           
          智快科技微信賬號(hào)
          微信群

          微信掃一掃
          加微信拉群
          電動(dòng)汽車群
          科技數(shù)碼群

          97久久国产综合精品女不卡| 狠狠综合视频精品播放| 91精品国产91久久久久| 精品久久久久久综合日本| 久久99精品国产麻豆蜜芽| 日韩在线免费看网站| 中文字幕日韩亚洲| 国产成人精品无码专区| 国产精品久久无码一区二区三区网| 日本午夜精品视频在线观看| 亚洲国产精品美女| 久久精品国产精品亚洲毛片| 久久精品中文字幕第一页| 精品久久一区二区三区| 国产啪精品视频网站| 久久精品?ⅴ无码中文字幕| 国产精品亚洲w码日韩中文| 四虎永久在线精品免费一区二区 | 中文字幕无码日韩专区| 国产精品免费视频一区| 国产精品白浆无码流出| 国产精品爽爽V在线观看无码| 国内精品免费视频自在线| 图片区精品综合自拍| 国产精品久久久久乳精品爆| 午夜福利麻豆国产精品| 亚洲精品精华液一区二区 | 在线观看日韩精品 | 国产在线拍揄自揄视精品| 久久国产精品成人无码网站| 久久久久无码精品国产app| 久久精品国产72国产精| 国内揄拍国内精品少妇国语| 成人无码精品一区二区三区| 国产精品成人网站| 日韩大片在线永久免费观看网站| 国产乱人伦app精品久久| 日韩av.com| 精品国偷自产在线不卡短视频 | 无码国内精品久久人妻蜜桃| 99热这里只有精品99|