智快網 - 新科技與新能源行業網絡媒體

          阿里通義千問Qwen2.5-1M模型開源,長上下文處理能力大幅提升!

             發布時間:2025-01-27 07:52 作者:趙云飛

          阿里通義千問于近日正式宣布,開源了其最新的Qwen2.5-1M模型及其配套的推理框架。這一舉措標志著通義千問在人工智能領域邁出了重要一步。

          據悉,通義千問此次發布的開源模型包括Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M兩個版本。尤為引人注目的是,這兩個版本首次將Qwen模型的上下文長度擴展到了1M(即100萬標記),這在業界尚屬首次。

          為了幫助開發者更好地部署和應用這些模型,Qwen團隊還開源了基于vLLM的推理框架。該框架集成了稀疏注意力方法,使得在處理長達1M標記的輸入時,推理速度有了顯著提升,達到了3倍至7倍的增長。

          在長上下文任務方面,Qwen2.5-1M系列模型展現出了強大的能力。在一項名為“大海撈針”的任務中,這些模型能夠準確地從1M長度的文檔中檢索出隱藏信息。盡管7B版本的模型在極少數情況下出現了錯誤,但整體上,其表現仍然令人矚目。

          為了全面評估Qwen2.5-1M系列模型在長上下文任務中的表現,研究團隊還選擇了RULER、LV-eval和LongbenchChat等多個測試集進行測試。測試結果顯示,這些模型在大多數任務中都顯著優于之前的128K版本,特別是在處理超過64K長度的任務時,其優勢更加明顯。

          Qwen2.5-14B-Instruct-1M模型不僅在性能上擊敗了Qwen2.5-Turbo,還在多個數據集上穩定超越了GPT-4o-mini。這一結果無疑為長上下文任務提供了更多開源模型的選擇。

          除了長上下文任務外,Qwen2.5-1M系列模型在短序列任務上的表現同樣出色。測試結果顯示,Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M在短文本任務上的表現與其128K版本相當,這意味著增加長序列處理能力并沒有犧牲其基本能力。

          與GPT-4o-mini相比,Qwen2.5-14B-Instruct-1M和Qwen2.5-Turbo在短文本任務上實現了相近的性能,但它們的上下文長度卻是GPT-4o-mini的八倍。這一結果進一步證明了Qwen2.5-1M系列模型在短序列任務上的強大實力。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          99久久免费精品视频| 亚洲Av无码精品色午夜| 亚洲午夜精品在线| 久久精品国产只有精品66| 日韩AV毛片精品久久久| 国产精品亚洲一区二区在线观看| 国产精品电影在线观看| 91大神在线精品网址| 少妇人妻偷人精品免费视频| 国产精品免费高清在线观看| 精品国产网红福利在线观看| 国产在线精品一区二区中文| 中文精品久久久久人妻不卡| 国产拍揄自揄精品视频| 国产成人精品无码一区二区三区| 久久人人爽人人精品视频| 久久国产成人亚洲精品影院| 国产乱人伦偷精品视频免观看| 国产精品主播一区二区| 精品国产婷婷久久久| 精品人妻无码专区中文字幕| 国产精品久久久久久久久| 国产成人精品日本亚洲18图| 国产精品免费观看| 99久久国产热无码精品免费| 3D动漫精品啪啪一区二区下载| 成人精品一区二区户外勾搭野战| 成人精品一区二区户外勾搭野战| 香蕉视频国产精品| 精品国产乱码久久久久久郑州公司| 成人国产精品秘片多多| 日韩精品视频免费网址| 国产在线精品一区在线观看| 国产一区二区精品在线观看| 亚洲日韩激情无码一区| 日韩精品无码区免费专区 | 欧日韩不卡在线视频| 日韩人妻系列无码专区| 亚洲国产精品无码久久青草| 亚洲精品偷拍视频免费观看| 老司机精品免费视频|