近日,阿里巴巴旗下AI領(lǐng)域的重大動態(tài)引發(fā)了廣泛關(guān)注。據(jù)可靠消息透露,阿里通義千問開源項目的領(lǐng)軍人物林俊旸,在某一平臺上發(fā)布了一條引人遐想的消息,暗示Qwen3系列模型或?qū)⒂诮诿媸馈?/p>
值得注意的是,Qwen3系列模型此前曾在阿里巴巴的AI模型開源社區(qū)ModelScope(魔搭)上短暫亮相,隨后又悄然下線。這一系列包括了Qwen3-4B-Base、Qwen3-1.7B、Qwen3-0.6B以及Qwen3-30B-A3B-Base四款模型,全部遵循Apache License 2.0開源協(xié)議。盡管官方尚未發(fā)布正式公告,但通過觀察命名規(guī)則與前代技術(shù)的邏輯,業(yè)界對其技術(shù)路徑和定位方向已有初步推測。
在即將發(fā)布的模型中,Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B以參數(shù)規(guī)模直接命名,分別對應(yīng)40億、17億和6億參數(shù)。這種無后綴的命名方式,或許意味著它們采用的是單架構(gòu)稠密模型,并未采用混合專家(MoE)設(shè)計,更側(cè)重于輕量化應(yīng)用場景。而Qwen3-30B-A3B-Base則是一款MoE架構(gòu)的基礎(chǔ)模型,其總參數(shù)達到300億(30B),但在處理任務(wù)時僅動態(tài)調(diào)用30億(3B)參數(shù)。
據(jù)AIbase的報道,Qwen3系列模型在功能上也頗具亮點,其支持高達256K的上下文長度,能夠涵蓋推理與非推理任務(wù),這無疑將極大地提升其在各種應(yīng)用場景下的表現(xiàn)。
回顧過去,自2023年8月以來,阿里云在開源AI模型方面取得了顯著進展,相繼推出了Qwen、Qwen1.5、Qwen2、Qwen2.5等四代模型,覆蓋了從0.5B到110B的全尺寸范圍,以及大語言、多模態(tài)、數(shù)學(xué)和代碼等全模態(tài)領(lǐng)域。這一系列動作不僅展示了阿里云在AI領(lǐng)域的深厚積累,也為其在全球范圍內(nèi)的競爭力注入了新的活力。