在科技界的一次重大突破中,OpenAI悄然推出了其最新的創(chuàng)新產(chǎn)品——ChatGPT Agent,這一產(chǎn)品的問世標(biāo)志著AI技術(shù)邁入了一個(gè)全新的階段。
北京時(shí)間周五凌晨,OpenAI通過一場直播活動,向全球用戶展示了這款具備通用智能體(Agent)能力的AI產(chǎn)品。ChatGPT Agent不僅繼承了ChatGPT的對話與推理能力,更實(shí)現(xiàn)了關(guān)鍵性的升級,能夠主動規(guī)劃行動,利用多種工具完成復(fù)雜任務(wù)。
與以往的基礎(chǔ)大模型升級不同,ChatGPT Agent能夠自動瀏覽用戶日歷、生成可編輯的PPT、運(yùn)行代碼等,甚至能夠連接Gmail、GitHub等網(wǎng)站獲取信息并解決問題。這一能力的大幅提升,使得AI智能體在實(shí)際應(yīng)用中展現(xiàn)出了前所未有的潛力。
據(jù)OpenAI介紹,ChatGPT Agent目前已經(jīng)向OpenAI Pro、Plus和Team計(jì)劃的訂閱用戶開放。用戶只需在ChatGPT的工具下拉菜單中選擇“Agent模式”,即可體驗(yàn)這一全新功能。而企業(yè)版和教育版用戶則預(yù)計(jì)將于夏季晚些時(shí)候獲得該功能。
在正式發(fā)布時(shí),Pro用戶每月最多可使用400次Agent提示,其他付費(fèi)用戶則最多可使用40次。雖然目前尚不清楚該功能何時(shí)會面向ChatGPT免費(fèi)用戶推出,但這一創(chuàng)新已經(jīng)引起了業(yè)界的廣泛關(guān)注。
OpenAI CEO山姆·奧特曼(Sam Altman)表示,看著ChatGPT智能體使用計(jì)算機(jī)執(zhí)行復(fù)雜任務(wù),對他來說是一個(gè)真正的“感受AGI”的時(shí)刻。他強(qiáng)調(diào),看到計(jì)算機(jī)思考、計(jì)劃和執(zhí)行,會帶來截然不同的感受。
ChatGPT Agent的核心是一個(gè)統(tǒng)一的智能agentic系統(tǒng),它結(jié)合了Operator的網(wǎng)站交互能力、deep research的信息綜合能力以及ChatGPT的智能推理與對話能力。這使得ChatGPT Agent能夠在使用多個(gè)工具時(shí)保留任務(wù)所需的上下文信息,并根據(jù)需要靈活切換推理與執(zhí)行。
例如,用戶可以讓ChatGPT Agent執(zhí)行“查詢年度財(cái)務(wù)報(bào)告”等請求,智能地瀏覽網(wǎng)站、篩選結(jié)果,并在需要時(shí)提示用戶安全登錄。運(yùn)行代碼、進(jìn)行分析,甚至交付可編輯的幻燈片和電子表格等復(fù)雜任務(wù),ChatGPT Agent也能輕松應(yīng)對。
ChatGPT Agent還配備了一整套工具,包括可視化瀏覽器、文本瀏覽器、終端以及直接調(diào)用API的能力。這使得它能夠選擇最優(yōu)路徑,以最高效的方式完成任務(wù)。同時(shí),用戶也始終掌控全局,可以在任何時(shí)候中斷任務(wù)、接管瀏覽器或停止運(yùn)行。
在基準(zhǔn)測試中,ChatGPT Agent也展現(xiàn)出了卓越的性能。在“人類最后考試”評估中,支持ChatGPT Agent的模型獲得了41.6的Pass@1分?jǐn)?shù)。在具備工具使用能力的情況下,ChatGPT Agent在FrontierMath基準(zhǔn)測試中達(dá)到了27.4%的準(zhǔn)確率,遠(yuǎn)遠(yuǎn)超越此前的所有模型。
在模擬復(fù)雜真實(shí)任務(wù)的基準(zhǔn)測試中,ChatGPT Agent的輸出在大約一半的情況下可與人類相媲美,甚至優(yōu)于人類。在DSBench和SpreadsheetBench等基準(zhǔn)測試中,ChatGPT Agent也均超越了人類的平均表現(xiàn)。
然而,盡管ChatGPT Agent效用巨大,但潛在的風(fēng)險(xiǎn)也不容忽視。OpenAI已在其中構(gòu)建了大量的安全措施和警告,以及比以往任何時(shí)候都更廣泛的緩解措施。但山姆·奧特曼也坦言,他們無法預(yù)見一切,因此將向用戶發(fā)出很多警告,并給予用戶自主選擇是否謹(jǐn)慎采取行動的自由。
他建議用戶授予Agent完成任務(wù)所需的最低訪問權(quán)限,以降低隱私和安全風(fēng)險(xiǎn)。同時(shí),他也強(qiáng)調(diào),這是一個(gè)嘗試未來的機(jī)會,但在有機(jī)會在現(xiàn)實(shí)世界研究和改進(jìn)它之前,不應(yīng)將其用于高風(fēng)險(xiǎn)用途或獲取大量個(gè)人信息。
不少網(wǎng)友已經(jīng)提前體驗(yàn)了ChatGPT Agent的功能,并對其表現(xiàn)給予了高度評價(jià)。有網(wǎng)友表示,ChatGPT Agent在創(chuàng)建提前退休計(jì)劃、完成購物任務(wù)等方面展現(xiàn)出了驚人的能力,大大節(jié)省了時(shí)間和精力。
然而,也有網(wǎng)友指出,ChatGPT Agent在執(zhí)行任務(wù)的過程中仍有一定的改進(jìn)空間。例如,在某些情況下,手動操作可能會比使用ChatGPT Agent更高效。
無論如何,ChatGPT Agent的問世無疑為AI技術(shù)的發(fā)展注入了新的活力。隨著技術(shù)的不斷進(jìn)步和應(yīng)用場景的不斷拓展,我們有理由相信,AI將在未來發(fā)揮更加重要的作用。