久久精品国产综合,一区二区三区av电影,free性欧美高清另类

阿里發(fā)布ZeroSearch模型，無需搜索引擎即可自我提升搜索能力

發(fā)布時(shí)間：2025-05-09 21:13 來源：ITBEAR 作者：顧雨柔

阿里巴巴近期在人工智能領(lǐng)域邁出了重要一步，正式開源了一款名為ZeroSearch的大模型，這一創(chuàng)新技術(shù)被標(biāo)榜為無需依賴真實(shí)搜索引擎便能激發(fā)強(qiáng)大搜索能力的解決方案。

據(jù)官方介紹，ZeroSearch是一個(gè)基于強(qiáng)化學(xué)習(xí)的框架，其核心在于提升大型語言模型（LLM）的搜索效能，而這一切的實(shí)現(xiàn)無需借助任何真實(shí)的搜索引擎。這一技術(shù)突破，為LLM在搜索領(lǐng)域的應(yīng)用開辟了新的路徑。

在開發(fā)過程中，阿里巴巴的研究團(tuán)隊(duì)首先通過監(jiān)督式微調(diào)，將LLM轉(zhuǎn)化為一個(gè)檢索模塊，該模塊能夠針對查詢生成相關(guān)或含有噪聲的文檔。為了進(jìn)一步激發(fā)模型的推理潛能，他們引入了課程化展開機(jī)制。這一機(jī)制通過逐步增加檢索任務(wù)的復(fù)雜性，讓模型在不斷挑戰(zhàn)中鍛煉其思考能力。

經(jīng)過在多個(gè)領(lǐng)域內(nèi)外數(shù)據(jù)集的廣泛實(shí)驗(yàn)，結(jié)果顯示，ZeroSearch在沒有產(chǎn)生任何API費(fèi)用的情況下，其性能甚至超越了基于真實(shí)搜索引擎的模型。這一成果不僅彰顯了ZeroSearch的高效性，也體現(xiàn)了其在成本控制上的顯著優(yōu)勢。

ZeroSearch還展現(xiàn)出了良好的泛化能力。它能夠在不同規(guī)模的基礎(chǔ)型和指令微調(diào)型LLM上穩(wěn)定運(yùn)行，并支持多種強(qiáng)化學(xué)習(xí)算法。這一特性使得ZeroSearch在實(shí)際應(yīng)用中具有更高的靈活性和適應(yīng)性。

在7大問答數(shù)據(jù)集評測中，ZeroSearch的性能表現(xiàn)尤為亮眼。數(shù)據(jù)顯示，其70億參數(shù)模型的得分高達(dá)33.06，超越了谷歌搜索的32.47分。同時(shí)，與通過SerpAPI使用谷歌搜索訓(xùn)練所需的高昂費(fèi)用相比，使用140億參數(shù)的模擬LLM在四個(gè)A100 GPU上進(jìn)行訓(xùn)練的成本降低了87.93%。具體而言，通過SerpAPI訓(xùn)練64,000個(gè)查詢的費(fèi)用約為586.70美元，而使用ZeroSearch的訓(xùn)練成本僅為70.80美元。

目前，ZeroSearch已在Qwen-2.5、LLaMA-3.2等多個(gè)主流模型家族中得到了驗(yàn)證。為了推動這一技術(shù)的廣泛應(yīng)用和發(fā)展，阿里巴巴研究團(tuán)隊(duì)已將全部代碼、數(shù)據(jù)集及預(yù)訓(xùn)練模型開源至GitHub和Hugging Face平臺。這一舉措無疑將為更多開發(fā)者提供學(xué)習(xí)和應(yīng)用ZeroSearch的機(jī)會，共同推動人工智能領(lǐng)域的創(chuàng)新與發(fā)展。

開源地址：（點(diǎn)擊此處訪問）

更多>同類內(nèi)容