近日,阿里巴巴旗下AI領域的重大動態引發了廣泛關注。據可靠消息透露,阿里通義千問開源項目的領軍人物林俊旸,在某一平臺上發布了一條引人遐想的消息,暗示Qwen3系列模型或將于近期面世。
值得注意的是,Qwen3系列模型此前曾在阿里巴巴的AI模型開源社區ModelScope(魔搭)上短暫亮相,隨后又悄然下線。這一系列包括了Qwen3-4B-Base、Qwen3-1.7B、Qwen3-0.6B以及Qwen3-30B-A3B-Base四款模型,全部遵循Apache License 2.0開源協議。盡管官方尚未發布正式公告,但通過觀察命名規則與前代技術的邏輯,業界對其技術路徑和定位方向已有初步推測。
在即將發布的模型中,Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B以參數規模直接命名,分別對應40億、17億和6億參數。這種無后綴的命名方式,或許意味著它們采用的是單架構稠密模型,并未采用混合專家(MoE)設計,更側重于輕量化應用場景。而Qwen3-30B-A3B-Base則是一款MoE架構的基礎模型,其總參數達到300億(30B),但在處理任務時僅動態調用30億(3B)參數。
據AIbase的報道,Qwen3系列模型在功能上也頗具亮點,其支持高達256K的上下文長度,能夠涵蓋推理與非推理任務,這無疑將極大地提升其在各種應用場景下的表現。
回顧過去,自2023年8月以來,阿里云在開源AI模型方面取得了顯著進展,相繼推出了Qwen、Qwen1.5、Qwen2、Qwen2.5等四代模型,覆蓋了從0.5B到110B的全尺寸范圍,以及大語言、多模態、數學和代碼等全模態領域。這一系列動作不僅展示了阿里云在AI領域的深厚積累,也為其在全球范圍內的競爭力注入了新的活力。