智快網 - 新科技與新能源行業網絡媒體

          AMD ROCm 6.3重磅更新:加速AI推理,Fortran編譯器亮相

             發布時間:2024-11-27 10:19 作者:江紫萱

          AMD近日在AI及高性能計算領域邁出重要一步,發布了ROCm 6.3版本更新。此次更新不僅集成了專為AI推理加速設計的SGLang運行時,還對FlashAttention-2進行了全面優化,旨在提升AI訓練和推理的效率。

          SGLang的加入,標志著AMD在優化大型語言模型(LLMs)和視覺語言模型(VLMs)推理方面取得了新進展。AMD承諾,通過集成SGLang,能夠在AMD Instinct GPU上實現高達6倍的吞吐量提升。SGLang還支持Python,并配備了預配置的ROCm Docker容器,為用戶提供了更為便捷的使用體驗。

          在FlashAttention-2方面,AMD進行了全面革新。相較于FlashAttention-1,新版本在前向和后向傳遞方面取得了顯著改進,從而大幅提升了Transformer模型的訓練和推理速度。這一改進對于依賴Transformer架構的AI應用而言,無疑是一個重大利好。

          除了上述更新外,AMD還推出了全新的Fortran編譯器。這款編譯器支持直接GPU卸載,與舊版本兼容,并完美集成了HIP內核和ROCm庫。這為Fortran開發者提供了更為強大的GPU計算能力,使他們能夠更高效地利用AMD GPU進行高性能計算。

          在圖像和視頻處理方面,ROCm 6.3也帶來了諸多增強。rocDecode、rocJPEG和rocAL等計算機視覺庫得到了全面升級,分別支持AV1編解碼、GPU加速JPEG解碼以及更優的音頻增強功能。這些改進為圖像和視頻處理應用提供了更為強大的支持,使得AMD GPU在多媒體處理領域也展現出了出色的性能。

          ROCm(Radeon Open Compute)是AMD開發的一個開源軟件棧,旨在支持在AMD GPU上進行編程。它包含了驅動程序、開發工具和API,支持從底層內核到最終用戶應用程序的GPU編程。ROCm針對生成式AI和高性能計算(HPC)應用進行了優化,并涵蓋了通用計算(GPGPU)、高性能計算(HPC)和異構計算等多個領域。

          此次ROCm 6.3的發布,不僅展示了AMD在AI和高性能計算領域的持續投入和創新,也為廣大開發者提供了更為強大和便捷的編程工具。相信隨著ROCm的不斷完善和發展,AMD GPU將在更多領域展現出其卓越的性能和潛力。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          手机在线看片国产日韩生活片| 99久久人妻精品免费一区| 国产成人久久精品区一区二区| 日韩精品在线观看视频| 日韩精品中文字幕第2页| 国产乱码一二三区精品| 精品欧洲男同同志videos| 国产成人综合一区精品| 亚洲精品乱码久久久久久下载 | 国产日韩视频在线| 国产伦精品一区二区三区四区| 国内精品视频一区二区三区| 国产精品1024| 久久久午夜精品福利内容| 亚洲国产精品网站久久| 538精品在线视频| 99re热这里有精品首页视频| 亚洲AV日韩精品久久久久| 久久国产精品自由自在| 亚洲AV无码精品色午夜在线观看| 亚洲精品国产精品乱码视色 | 中文字幕免费视频精品一| 精品国产福利尤物免费| 国产福利电影一区二区三区久久久久成人精品综合 | 国产成人无码精品一区在线观看| 日韩一区二区三区不卡视频| 欧美日韩综合一区二区三区| 日韩免费电影网站| 日韩最新视频一区二区三| 中日韩无砖码一线二线| 日韩精品一线二线三线优势| 日韩亚洲国产综合高清| 日韩电影中文字幕在线网站 | 亚洲蜜芽在线精品一区| 亚洲精品欧洲精品| 国产精品久久久久久搜索| 色综合久久夜色精品国产| 91精品视频免费| 亚洲国产精品99久久久久久| 久久久久无码精品国产h动漫| 国产精品久久久福利|