智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

          清華開源赤兔大模型推理引擎,國產(chǎn)芯片上DeepSeek推理成本減半性能翻倍

             發(fā)布時間:2025-03-14 20:59 作者:陸辰風(fēng)

          清華大學(xué)高性能計算研究所傳來重要消息,翟季冬教授團(tuán)隊攜手清華系科創(chuàng)先鋒清程極智,共同宣布了一項重大開源成果——大模型推理引擎“赤兔 Chitu”。

          這款引擎開創(chuàng)性地實現(xiàn)了在非英偉達(dá)Hopper架構(gòu)GPU及眾多國產(chǎn)芯片上的FP8精度模型原生運行,顯著降低了推理成本,性能更是實現(xiàn)了翻倍。據(jù)悉,赤兔引擎被精準(zhǔn)定位為“生產(chǎn)級大模型推理引擎”,旨在為用戶帶來多重優(yōu)勢。

          首先,赤兔引擎具備強(qiáng)大的多元算力適配能力。無論是NVIDIA的最新旗艦產(chǎn)品,還是舊款的多系列產(chǎn)品,亦或是國產(chǎn)芯片,赤兔引擎都能提供優(yōu)化的支持,確保了廣泛的兼容性。

          其次,赤兔引擎全場景可伸縮的特性使其應(yīng)用場景更加靈活。無論是純CPU部署、單GPU部署,還是大規(guī)模集群部署,赤兔引擎都能提供可擴(kuò)展的解決方案,滿足不同場景下的需求。

          赤兔引擎的長期穩(wěn)定運行能力也是其一大亮點。在實際生產(chǎn)環(huán)境中,赤兔引擎的穩(wěn)定性足以承載高并發(fā)的業(yè)務(wù)流量,確保了業(yè)務(wù)的連續(xù)性和穩(wěn)定性。

          在部署DeepSeek-R1-671B滿血版時,赤兔引擎在A800集群的測試中展現(xiàn)出了卓越的性能。與部分國外開源框架相比,赤兔引擎在實現(xiàn)GPU使用量減少50%的同時,推理速度還提升了3.15倍,這一成績無疑令人矚目。

          對于廣大開發(fā)者和用戶而言,赤兔引擎的開源無疑是一個巨大的福音。現(xiàn)在,大家可以通過訪問GitHub上的開源地址(https://github.com/thu-pacman/chitu),輕松獲取并體驗這款強(qiáng)大的大模型推理引擎。

           
           
          更多>同類內(nèi)容
          全站最新
          熱門內(nèi)容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數(shù)碼群

          人妻无码久久精品| 日韩免费高清大片在线| 精品人妻中文字幕有码在线| 国产成人精品日本亚洲| 日产精品一线二线三线京东| 国产偷窥熟女高潮精品视频| 亚欧洲精品在线视频免费观看| 亚洲欧美日韩中文二区| 手机日韩精品视频在线看网站| 国产精品主播叶子闺蜜| 精品国产免费观看一区| 国产精品美女久久久久浪潮AV| 亚洲欧美日韩久久精品| 亚洲国产美女精品久久久| 久久精品免费全国观看国产| 99久久人妻无码精品系列蜜桃| 精品国产福利片在线观看| 日韩精品免费一级视频 | 国产精品国产自线拍免费软件| 国产精品成人国产乱| 成人H动漫精品一区二区| 成人精品视频一区二区| 国产精品VIDEOSSEX久久发布| 精品人妻无码一区二区三区蜜桃一| 精品国产乱码欠欠欠欠精品| 精品videossexfreeohdbbw| 国产成人精品高清在线观看96| 免费精品一区二区三区在线观看| 最新国产精品好看的国产精品| 国产精品自在自线免费观看| 国产成人精品午夜在线播放| 国产乱人伦偷精品视频下| 日韩一区二区三区在线精品| 亚洲区日韩精品中文字幕| 精品视频一区二区观看| 国产福利精品视频自拍| 久久99精品国产麻豆蜜芽| 亚洲精品国产精品乱码视色| 精品久久一区二区三区| 无码精品A∨在线观看| 69精品久久久久|