OpenAI近期宣布推出一款創(chuàng)新性的通用AI助手——ChatGPT代理,據(jù)稱,這款助手能夠代為用戶執(zhí)行多樣化的計算機(jī)任務(wù)。
這款ChatGPT代理不僅具備自動瀏覽用戶日歷的功能,還能夠生成可編輯的演示文檔和幻燈片,并擁有運行代碼的能力。OpenAI強(qiáng)調(diào),這些功能的融合使得ChatGPT代理成為了一個多功能的數(shù)字助手。
ChatGPT代理整合了OpenAI之前多款代理工具的核心功能,例如Operator的網(wǎng)頁點擊能力,以及Deep Research將多個網(wǎng)站信息綜合成簡潔研究報告的能力。用戶只需通過自然語言與ChatGPT代理交流,即可輕松享受這些服務(wù)。
OpenAI計劃于周四向Pro、Plus和Team計劃的訂閱用戶推出這款ChatGPT代理。用戶只需在ChatGPT的工具下拉菜單中選擇代理模式,即可激活這一功能。
此次ChatGPT代理的推出,標(biāo)志著OpenAI在AI助手領(lǐng)域的一次大膽嘗試。OpenAI希望將ChatGPT從單一的問答工具轉(zhuǎn)變?yōu)槟軌蛑鲃訄?zhí)行任務(wù)、減輕用戶負(fù)擔(dān)的全方位助手。
近年來,硅谷的多家公司,包括OpenAI、谷歌和Perplexity,都推出了旨在實現(xiàn)類似目標(biāo)的AI助手。然而,這些早期版本的AI助手在處理復(fù)雜任務(wù)時表現(xiàn)平平,且未能完全達(dá)到科技高管們所描繪的終極愿景。
盡管如此,OpenAI表示,ChatGPT代理在功能上遠(yuǎn)超其以往的產(chǎn)品。新代理能夠接入ChatGPT連接器,使用戶能夠連接Gmail、GitHub等應(yīng)用程序,以便代理能夠檢索與用戶需求相關(guān)的信息。ChatGPT代理還能訪問終端,并通過API與特定應(yīng)用程序進(jìn)行交互。
OpenAI鼓勵用戶利用ChatGPT代理進(jìn)行更復(fù)雜的任務(wù),如“規(guī)劃并購買食材制作四人份日式早餐”,或“分析競爭對手并制作幻燈片”。這些功能要求ChatGPT代理能夠解析網(wǎng)頁、制定行動方案,并使用工具,這在OpenAI以往的代理產(chǎn)品中并不常見。
OpenAI指出,ChatGPT代理所基于的模型在多個基準(zhǔn)測試中展現(xiàn)出了卓越的性能。在Humanity的Last Exam考試中,該模型獲得了41.6%的分?jǐn)?shù),遠(yuǎn)超OpenAI的o3和o4-mini的得分。在FrontierMath這一難度極高的數(shù)學(xué)基準(zhǔn)測試中,ChatGPT代理在能夠使用工具的情況下得分高達(dá)27.4%,遠(yuǎn)超此前的最高得分6.3%。
在開發(fā)ChatGPT代理時,OpenAI將安全性視為首要考慮因素。鑒于這款新產(chǎn)品的一些新功能可能在不法分子手中變得危險,OpenAI采取了多項預(yù)防措施。例如,在生物和化學(xué)武器領(lǐng)域,該模型被評定為高能力,OpenAI因此啟動了新的保障措施以降低潛在風(fēng)險。
為了確保安全,OpenAI在ChatGPT代理中設(shè)置了一個實時運行的監(jiān)視器。每當(dāng)用戶向ChatGPT代理發(fā)出請求時,該監(jiān)視器都會運行一個分類器,以判斷請求是否與生物學(xué)相關(guān)。如果是,那么ChatGPT代理的響應(yīng)將經(jīng)過第二個監(jiān)視器的檢查,以確保內(nèi)容不會被用于制造生物威脅。
為了防止濫用,OpenAI還禁用了ChatGPT代理的記憶功能。在ChatGPT的其他版本中,記憶功能允許聊天機(jī)器人引用之前的聊天記錄。然而,OpenAI擔(dān)心不法分子可能會利用這一功能進(jìn)行快速注入攻擊,竊取敏感數(shù)據(jù)。不過,OpenAI表示未來可能會重新考慮啟用這一功能。
盡管ChatGPT代理聽起來非常強(qiáng)大,但它在現(xiàn)實世界中的表現(xiàn)仍有待驗證。迄今為止,代理技術(shù)在與現(xiàn)實世界交互時一直面臨著諸多挑戰(zhàn)。然而,OpenAI表示,他們已經(jīng)開發(fā)出了一款功能更為強(qiáng)大的模型,有望兌現(xiàn)AI助手的承諾。