在科技界萬眾矚目的矚目下,OpenAI于本周二震撼發(fā)布了全新工具套件,旨在賦能開發(fā)者與企業(yè),利用OpenAI的尖端AI模型和框架,打造能夠自主執(zhí)行任務(wù)的智能代理系統(tǒng)。這些創(chuàng)新工具作為OpenAI新推出的Responses API的核心組成部分,預(yù)示著AI代理技術(shù)邁入了一個(gè)全新的發(fā)展階段。
Responses API的推出,標(biāo)志著OpenAI正逐步取代其原有的Assistants API,計(jì)劃在2026年上半年全面完成這一過渡。通過該API,企業(yè)得以開發(fā)定制化的AI代理,這些代理能夠執(zhí)行諸如網(wǎng)絡(luò)搜索、公司內(nèi)部文檔檢索以及網(wǎng)頁瀏覽等復(fù)雜任務(wù),其功能與OpenAI的Operator產(chǎn)品不相上下。
盡管近年來科技界對(duì)于AI代理的炒作聲浪此起彼伏,但真正能夠清晰定義并展示AI代理實(shí)際應(yīng)用價(jià)值的案例卻寥寥無幾。例如,中國初創(chuàng)公司Butterfly Effect近期推出的Manus AI代理平臺(tái),雖然在網(wǎng)絡(luò)上引發(fā)了廣泛關(guān)注,但很快便因未能兌現(xiàn)諸多承諾而遭到用戶的質(zhì)疑。
面對(duì)這一挑戰(zhàn),OpenAI深知讓AI代理穩(wěn)定運(yùn)行并廣泛應(yīng)用的難度之大。OpenAI的API產(chǎn)品負(fù)責(zé)人Olivier Godement在接受采訪時(shí)坦言:“展示AI代理的功能或許輕而易舉,但要想將其規(guī)模化應(yīng)用,并讓用戶頻繁使用,卻是難上加難。”
為了破解這一難題,OpenAI在今年早些時(shí)候通過ChatGPT引入了Operator和Deep Research兩款A(yù)I代理工具,它們分別能夠代表用戶瀏覽網(wǎng)頁和編制研究報(bào)告。盡管這兩款工具初步展示了AI代理的潛力,但在自主性方面仍有待提升。如今,借助Responses API,OpenAI希望向開發(fā)者開放構(gòu)建自主AI代理所需的組件,推動(dòng)開發(fā)者創(chuàng)造出比現(xiàn)有應(yīng)用更加智能的代理程序。
Responses API還內(nèi)置了文件搜索工具,能夠迅速掃描公司數(shù)據(jù)庫中的文件以檢索信息,同時(shí)保證不會(huì)在這些文件上訓(xùn)練模型。更重要的是,開發(fā)者可以利用OpenAI的計(jì)算機(jī)使用代理(CUA)模型,該模型為Operator提供了強(qiáng)大的支持,能夠生成鼠標(biāo)和鍵盤操作,自動(dòng)化執(zhí)行數(shù)據(jù)輸入、應(yīng)用程序工作流等任務(wù)。
然而,值得注意的是,Responses API并不能一蹴而就地解決當(dāng)前AI代理面臨的所有技術(shù)難題。盡管AI搜索工具在準(zhǔn)確性方面相較于傳統(tǒng)AI模型有所提升,但仍存在10%的事實(shí)問題錯(cuò)誤率。同時(shí),AI搜索工具在處理簡短導(dǎo)航查詢時(shí)也面臨挑戰(zhàn),且ChatGPT的引用可靠性也備受爭(zhēng)議。
OpenAI在官方博客中指出,CUA模型在操作系統(tǒng)上自動(dòng)執(zhí)行任務(wù)時(shí)仍不夠可靠,且容易犯下“無意”錯(cuò)誤。盡管如此,OpenAI強(qiáng)調(diào)這些僅是代理工具的早期版本,并承諾將持續(xù)努力進(jìn)行改進(jìn)。
除了Responses API外,OpenAI還推出了名為Agents SDK的開源工具包,為開發(fā)者提供了將模型與內(nèi)部系統(tǒng)集成、實(shí)施保護(hù)措施以及監(jiān)控AI代理活動(dòng)所需的免費(fèi)工具。這一工具包是OpenAI Swarm的升級(jí)版,后者是該公司去年年底發(fā)布的多代理編排框架。
Godement表示,他期望OpenAI能夠在今年內(nèi)縮小AI代理演示與實(shí)際產(chǎn)品之間的差距,并堅(jiān)信代理將成為未來最具影響力的AI應(yīng)用之一。這一觀點(diǎn)與OpenAI首席執(zhí)行官Sam Altman一月份的宣言不謀而合,Altman曾預(yù)言2025年將是AI代理進(jìn)入勞動(dòng)力市場(chǎng)的一年。
無論2025年是否真正迎來AI代理的爆發(fā)之年,OpenAI的最新發(fā)布都彰顯了其從華而不實(shí)的演示轉(zhuǎn)向打造具有實(shí)際影響力的工具的決心。隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的不斷拓展,AI代理或?qū)⒅鸩匠蔀橥苿?dòng)社會(huì)進(jìn)步的重要力量。