智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

          低成本高效能!斯坦福團隊打造媲美OpenAI推理模型s1

             發(fā)布時間:2025-02-06 10:03 作者:顧雨柔

          近期,人工智能領(lǐng)域迎來了一項引人注目的新突破。據(jù)一份最新發(fā)布的研究報告顯示,斯坦福大學(xué)與華盛頓大學(xué)的科研團隊,僅憑不到50美元的云計算成本(當(dāng)前匯率下約364元人民幣),就成功打造了一款具備卓越“推理”能力的人工智能模型——s1。

          這款s1模型在數(shù)學(xué)與編程能力測試中,展現(xiàn)出了與OpenAI的o1、DeepSeek的r1等業(yè)界頂尖推理模型相媲美的水平。更令人矚目的是,s1模型及其訓(xùn)練數(shù)據(jù)和代碼已在GitHub平臺上全面開源,供全球開發(fā)者研究和使用。

          s1團隊揭秘,他們采用了“蒸餾”技術(shù)來創(chuàng)建這款模型。該技術(shù)通過訓(xùn)練模型來學(xué)習(xí)另一個AI模型的答案,從而提煉出其核心推理能力。據(jù)悉,s1模型是從谷歌的Gemini 2.0 Flash Thinking Experimental模型中蒸餾而來。而就在上個月,加州大學(xué)伯克利分校的研究人員也運用相同的蒸餾方法,以約450美元的成本開發(fā)了一款A(yù)I推理模型。

          隨著s1等類似模型的出現(xiàn),人工智能領(lǐng)域的商品化問題日益凸顯。當(dāng)有人能夠以極低的成本復(fù)制出價值數(shù)百萬美元的模型時,大型科技公司的競爭優(yōu)勢何在?這一問題引發(fā)了業(yè)界的廣泛關(guān)注和討論。

          面對這一挑戰(zhàn),大型AI實驗室紛紛表達不滿。例如,OpenAI就曾指責(zé)DeepSeek不當(dāng)獲取其API數(shù)據(jù)用于模型蒸餾。而s1團隊則致力于探索實現(xiàn)強大推理性能和“測試時擴展”的最簡潔途徑,這些正是OpenAI的o1模型所取得的突破。

          s1的論文指出,通過監(jiān)督微調(diào)(SFT)方法,可以使用較小的數(shù)據(jù)集來蒸餾推理模型。在SFT過程中,AI模型被明確指示在數(shù)據(jù)集中模仿特定行為。相較于DeepSeek用于訓(xùn)練R1模型的大規(guī)模強化學(xué)習(xí)方法,SFT更具成本效益。

          值得注意的是,谷歌通過其Google AI Studio平臺免費提供Gemini 2.0 Flash Thinking Experimental模型的訪問權(quán)限,但設(shè)有每日使用限制。然而,其使用條款明確禁止對模型進行逆向工程,以開發(fā)與谷歌自身AI產(chǎn)品競爭的服務(wù)。盡管如此,s1團隊還是巧妙地利用了這一資源。

          s1模型基于阿里巴巴旗下中國人工智能實驗室Qwen提供的一款小型、現(xiàn)成的免費AI模型。為了訓(xùn)練s1,研究人員精心策劃了一個包含1000個問題及其答案的數(shù)據(jù)集,并收集了谷歌Gemini 2.0 Flash Thinking Experimental對每個答案背后“思考”過程的輸出。

          在訓(xùn)練過程中,研究人員使用了16個Nvidia H100 GPU,耗時不到30分鐘,便成功訓(xùn)練出了s1模型。據(jù)參與該項目的斯坦福大學(xué)研究員Niklas Muennighoff透露,目前租用這些計算資源的成本約為20美元。這一低廉的成本再次凸顯了s1模型的性價比優(yōu)勢。

          為了進一步提升s1的性能,研究人員還采用了一個巧妙的技巧:讓s1在推理過程中“等待”。論文顯示,在s1的推理步驟中添加“等待”一詞,有助于模型獲得更為準(zhǔn)確的答案。這一發(fā)現(xiàn)為AI模型的優(yōu)化提供了新的思路。

           
           
          更多>同類內(nèi)容
          全站最新
          熱門內(nèi)容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數(shù)碼群

          日韩av人人夜夜澡人人爽| 久久久久亚洲精品美女| 日韩精品无码一区二区三区AV| 亚洲精品无码av中文字幕| 99re6这里只有精品视频| 国产成人精品午夜福利| 久久久久成人精品无码| 国产vA免费精品高清在线观看| 强制高潮18XXXXHD日韩| 亚洲AV日韩AV鸥美在线观看| 国产乱码精品一区二区三区四川 | 亚洲第一精品电影网| 国产精品视频白浆免费视频| 国产亚洲精品线观看动态图| 日韩高清一级毛片| 亚洲日韩精品国产3区| 国产区香蕉精品系列在线观看不卡| 成人国内精品视频在线观看| 日韩精品射精管理在线观看| 91久久精品国产免费一区| 99热这里只有精品7| 日韩精品无码一区二区三区 | 亚洲精品宾馆在线精品酒店| 国产成人精品日本亚洲专区6| 91www永久在线精品果冻传媒| 91精品91久久久久久| 久久精品免看国产| 久久精品国产亚洲夜色AV网站| 国产精品伦一区二区三级视频| 人人鲁人人莫人人爱精品| 99国产精品久久| 亚洲精品自产拍在线观看| 一本色道久久综合亚洲精品高清| 国产成人精品免费视频大全| 日本加勒比久久精品| 亚洲欧美日韩国产成人| 日韩成人无码中文字幕| 日韩人妻无码一区二区三区久久99 | 自拍偷自拍亚洲精品第1页| 热久久这里是精品6免费观看 | 人妻少妇精品专区性色AV|