人工智能領域迎來了一次重大突破,OpenAI公司近期推出了全新的ChatGPT智能體系統,這一創新成果在7月17日由OpenAI的首席執行官山姆·奧特曼及四位核心成員通過一場25分鐘的直播向全球揭曉。
這款智能體系統整合了Operator的遠程瀏覽器執行能力、Deep Research的網絡信息整合技術,以及ChatGPT的對話優勢,形成了一個統一的智能平臺。它不僅能夠思考,還能夠行動,自主地從其技能工具箱中選擇工具,并利用自身的計算能力完成任務。
奧特曼強調,這一智能體代表了AI系統能力的新里程碑。在此之前,Operator和Deep Research雖各有千秋,但各自存在局限。Operator能在網頁上處理內容,卻難以深入分析或撰寫詳細報告;而Deep Research雖擅長信息分析匯總,卻無法與網站互動,無法訪問需要用戶身份驗證的內容。OpenAI此次將兩者的優勢巧妙融合,打造出全新的ChatGPT智能體。
在Agent模式下,ChatGPT將使用自己的“虛擬電腦”來執行任務,根據用戶的指令處理復雜的工作。用戶可以與網站進行互動,甚至在同一聊天窗口中直接從對話過渡到直接請求操作,體驗前所未有的便捷。
在發布會上,OpenAI展示了ChatGPT Agent在執行多項任務時的出色表現,如購買西裝、制作貼紙、預訂酒店等。智能體在啟動虛擬電腦后,會迅速詢問用戶的具體需求,然后進行衣服的挑選。它會滑動網頁、查看商品詳情,并留下建議文字。智能體還能代替用戶完成下單操作,整個過程流暢而高效。
在“虛擬電腦”中,ChatGPT能夠保留任務所需的上下文,無論是使用文本瀏覽器還是可視化瀏覽器打開頁面,從網絡下載文件,還是在終端中運行命令進行操作,都能在可視化瀏覽器中查看輸出。同時,ChatGPT在執行重要操作前會請求用戶授權,用戶可以隨時中斷、控制瀏覽器或停止任務,還可以安排已完成的任務自動重復執行,如每周生成周報。
在“人類最后一次考試”評估中,ChatGPT agent模型的SOTA得分高達41.6,當采用簡單的并行部署策略進行擴展時,得分更是提升至44.4。在FrontierMath等基準測試中,ChatGPT Agent的準確率也遠超之前的模型,展現了其卓越的性能。
目前,Pro、Plus和Team用戶已經可以使用Agent模式,企業版和教育版用戶也將在未來幾周內獲得訪問權限。對于Pro用戶,每月有400次使用次數,其他付費用戶每月有40次使用次數,當然也可以通過付費獲得更多的使用量。