智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

          谷歌新推Gemini 2.0 Flash Thinking:能否成為AI推理新標(biāo)桿?

             發(fā)布時間:2024-12-20 08:02 作者:唐云澤

          谷歌近期發(fā)布了一款名為Gemini 2.0 Flash Thinking Experimental的新型人工智能推理模型,但該模型仍處于實驗階段,根據(jù)初步測試,其性能仍有待提升。

          這款新模型在谷歌的AI原型平臺AI Studio中可供使用,其全稱略顯冗長,但功能定位明確:專注于多模態(tài)理解、推理及編碼,尤其擅長解決編程、數(shù)學(xué)和物理等領(lǐng)域的復(fù)雜問題。AI Studio的產(chǎn)品負(fù)責(zé)人Logan Kilpatrick在平臺上的一篇帖子中,將Gemini 2.0 Flash Thinking Experimental描述為谷歌在推理技術(shù)探索上的初步嘗試。

          谷歌DeepMind的首席科學(xué)家Jeff Dean也在個人帖子中透露,這款模型經(jīng)過特殊訓(xùn)練,能夠通過思維強化其推理能力。他表示,當(dāng)增加推理時間計算時,模型展現(xiàn)出了令人鼓舞的成果。這里的推理時間計算,指的是模型在解決問題時所需的計算資源。

          Gemini 2.0 Flash Thinking Experimental是基于谷歌之前發(fā)布的Gemini 2.0 Flash模型構(gòu)建的,其設(shè)計理念與OpenAI的o1等推理模型相似。這類推理模型與其他人工智能的一大區(qū)別在于,它們能夠進(jìn)行有效的自我事實核查,從而避免陷入一些常見的人工智能陷阱。然而,推理模型通常需要更長的時間(幾秒到幾分鐘不等)來得出解決方案。

          在使用時,Gemini 2.0 Flash Thinking Experimental會在接收到提示后暫停片刻,然后考慮一系列相關(guān)提示,并在此過程中解釋其推理過程。經(jīng)過一段時間后,模型會給出它認(rèn)為最準(zhǔn)確的答案。但在實際測試中,這款模型也并非無懈可擊。例如,當(dāng)被問及單詞“strawberry”中有多少個R時,它錯誤地回答了兩個。

          自O(shè)penAI發(fā)布o(jì)1以來,谷歌并非唯一一家在推理模型領(lǐng)域發(fā)力的公司。許多競爭對手的人工智能實驗室也紛紛推出了自己的推理模型。例如,由量化交易員資助的人工智能研究公司DeepSeek在11月初發(fā)布了其首個推理模型DeepSeek-R1的預(yù)覽版。同月,阿里巴巴的Qwen團(tuán)隊也宣布了他們所謂的首個o1公開挑戰(zhàn)者。

          據(jù)彭博社10月份的報道,谷歌內(nèi)部有多個團(tuán)隊正在致力于推理模型的開發(fā)。而The Information在11月份的報道中進(jìn)一步透露,谷歌至少有200名研究人員專注于這項技術(shù)。這一趨勢反映出業(yè)界對于改進(jìn)生成式人工智能技術(shù)的迫切需求。然而,傳統(tǒng)的擴(kuò)展模型技術(shù)已經(jīng)逐漸失效,難以再帶來顯著的改進(jìn)效果。

          盡管推理模型在基準(zhǔn)測試中表現(xiàn)出色,但并非所有人都認(rèn)為這是最佳的發(fā)展方向。一方面,推理模型的價格昂貴,因為它們需要大量的計算能力來運行。另一方面,盡管這些模型在基準(zhǔn)測試中取得了不錯的成績,但它們能否保持這種進(jìn)步速度仍然是一個未知數(shù)。

          業(yè)界對于推理模型的探索仍在繼續(xù)。谷歌的Gemini 2.0 Flash Thinking Experimental只是眾多嘗試中的一次。隨著技術(shù)的不斷進(jìn)步和競爭的加劇,我們有理由期待未來會有更多創(chuàng)新性的推理模型涌現(xiàn)。

          然而,對于當(dāng)前的推理模型而言,它們?nèi)匀幻媾R著諸多挑戰(zhàn)和未知。如何在保證性能的同時降低成本,如何保持持續(xù)的進(jìn)步速度,以及如何更好地應(yīng)用于實際場景中,都是未來需要解決的問題。

           
           
          更多>同類內(nèi)容
          全站最新
          熱門內(nèi)容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數(shù)碼群

          精品国产区一区二区三区在线观看| 久久精品中文騷妇女内射| 日韩视频在线精品视频免费观看| 欧美人妻少妇精品久久黑人| 3d动漫精品啪啪一区二区免费| 国自产偷精品不卡在线| 国产精品青草视频免费播放| 亚洲毛片基地日韩毛片基地| 国产成人精品三级麻豆| 欧洲精品免费一区二区三区| 亚洲AV无码国产精品永久一区 | 国产精品免费观看久久| 91精品成人福利在线播放| 久久99国产综合精品女同| 香蕉久久夜色精品升级完成| 久久久精品午夜免费不卡| 中文无码久久精品| 97久久精品午夜一区二区| 成人区精品一区二区不卡| 国产精品无码国模私拍视频| 九九视频精品在线| 日产国产精品亚洲系列| 日韩乱码中文字幕视频| 2020无码专区人妻系列日韩| 在线观看国产日韩| 亚洲欧美日韩一区二区三区在线| 亚欧日韩毛片在线看免费网站| 日韩AV在线不卡一区二区三区| 国产综合精品一区二区| 国产自偷在线拍精品热| 精品午夜久久网成年网| 国产精品成人一区二区三区| 国产精品国产免费无码专区不卡| 国产精品资源在线观看| 国产精品k频道在线看| 日韩成人毛片高清视频免费看| 日韩AV无码一区二区三区不卡毛片| 无码欧精品亚洲日韩一区夜夜嗨| 日韩动漫av在线播放一区| 日韩欧国产精品一区综合无码| 日韩人妻一区二区三区蜜桃视频|