【智快網(wǎng)】3月18日消息,近日,科技界掀起了一股新的熱潮。馬斯克旗下的人工智能公司xAI在周日的官方聲明中,震撼宣布其大語言模型Grok-1正式開源。此舉意味著,公眾可以訪問github.com/xai-org/grok,按照指引獲取并使用該模型的權(quán)重和網(wǎng)絡(luò)架構(gòu)。
據(jù)悉,Grok-1是一款混合專家模型,擁有驚人的3140億參數(shù),這一數(shù)字在目前所有已開源的大語言模型中獨占鰲頭。如此龐大的參數(shù)規(guī)模,無疑將為大語言模型領(lǐng)域帶來前所未有的變革與突破。
據(jù)智快網(wǎng)了解,Grok-1是xAI團隊從頭開始訓(xùn)練的模型,其預(yù)訓(xùn)練階段已于去年10月圓滿完成。此次開源的是預(yù)訓(xùn)練結(jié)束時的原始基礎(chǔ)模型檢查點,尚未針對任何具體應(yīng)用進行微調(diào)。這意味著,開發(fā)者們可以根據(jù)自身需求,對Grok-1進行進一步的定制和優(yōu)化。
xAI在官網(wǎng)上透露,Grok-1是在海量文本數(shù)據(jù)上訓(xùn)練的基礎(chǔ)模型,其訓(xùn)練過程采用了JAX和Rust編程語言,并借助了團隊自定義的訓(xùn)練棧。如今,該模型的權(quán)重和架構(gòu)已按照Apache 2.0開源許可協(xié)議公開發(fā)布,為全球范圍內(nèi)的研究者和開發(fā)者提供了寶貴的資源。
盡管Grok-1的開源時間相較于馬斯克在社交媒體上公布的時間有所延遲,但這并未影響其在科技界的熱度。事實上,這一開源行動標(biāo)志著人工智能領(lǐng)域的一大進步,為整個行業(yè)注入了新的活力。
關(guān)于開源時間的定義,不同國家和地區(qū)可能存在差異。然而,按照國際標(biāo)準(zhǔn)化組織ISO 8601的規(guī)定,Grok-1的開源時間仍在馬斯克所提及的那一周范圍內(nèi)。這一細(xì)節(jié)雖然引發(fā)了部分討論,但并未影響Grok-1作為一款重要開源大語言模型的地位和影響力。