在科技界引發廣泛關注的消息中,OpenAI于近日悄然揭開了其最新產品的神秘面紗——ChatGPT Agent,這一創新之舉標志著Agent AI時代的到來,比預期中更早地步入了人們的視野。
在一次深夜的直播活動中,OpenAI正式發布了這款全新的ChatGPT Agent,它不僅實現了通用智能體能力的關鍵性飛躍,更預示著AI技術在實用性和智能化方面邁出了重要一步。這款Agent能夠自動規劃并利用多種工具,協助人們完成從瀏覽日歷到生成可編輯PPT、運行代碼等一系列復雜任務。
與以往的基礎大模型升級相比,ChatGPT Agent的最大亮點在于其作為一個通用Agent,能夠無縫連接Gmail、GitHub等應用,通過API訪問各種服務,并根據用戶需求執行一系列操作。這一能力在HLE基準測試中得到了驗證,ChatGPT Agent獲得了41.6%的分數,幾乎是o3和o4-mini的兩倍。
目前,ChatGPT Agent已向OpenAI Pro、Plus和Team計劃的訂閱用戶開放。用戶只需在ChatGPT的工具下拉菜單中選擇“Agent模式”,即可體驗這一全新功能。據OpenAI透露,企業版和教育版用戶預計將在夏季晚些時候獲得這一新功能,而Pro用戶每月最多可使用400次Agent提示,其他付費用戶則最多可使用40次。至于該功能何時會向ChatGPT免費用戶推出,目前尚不明朗。
OpenAI CEO山姆·奧特曼表示,親眼目睹ChatGPT Agent使用計算機執行復雜任務,對他來說是一個真正感受到AGI(通用人工智能)的時刻。這種計算機思考、計劃和執行的能力,帶來了前所未有的體驗。
ChatGPT Agent的核心在于一個統一的智能agentic系統,它結合了Operator的網站交互能力、deep research的信息綜合能力,以及ChatGPT的智能推理與對話能力。借助虛擬計算環境,ChatGPT Agent能夠在推理與執行之間靈活切換,根據用戶指令從頭到尾處理復雜的工作流程。
在實際應用中,用戶可以讓ChatGPT Agent執行諸如查詢年度財務報告等任務,它會智能地瀏覽網站、篩選結果,并在需要時提示用戶安全登錄。它還能運行代碼、進行分析,甚至交付可編輯的幻燈片和電子表格,總結研究成果。例如,輸入“搜索查詢舊金山市年度綜合財務報告(2020-2024年)”的提示后,ChatGPT Agent能夠迅速找到并整理相關信息。
OpenAI還為ChatGPT Agent配備了一整套工具,包括可視化瀏覽器、文本瀏覽器、終端以及直接調用API的能力。這些工具使得ChatGPT Agent能夠選擇最優路徑,以最高效的方式完成任務。同時,用戶始終掌控全局,可以在任何時候中斷任務、接管瀏覽器或停止運行。
在基準測試中,ChatGPT Agent展現出了卓越的能力。在“人類最后考試”評估中,支持ChatGPT Agent的模型獲得了41.6的Pass@1分數。在FrontierMath基準測試中,它在具備工具使用能力的情況下達到了27.4%的準確率,遠超此前所有模型。在模擬復雜真實任務的基準測試中,ChatGPT Agent的輸出在大約一半的情況下可與人類相媲美,甚至優于人類。
盡管ChatGPT Agent功能強大,但OpenAI也提醒用戶注意潛在的風險。山姆·奧特曼在推文中強調了安全措施和警告的重要性,并建議用戶授予Agent完成任務所需的最低訪問權限,以降低隱私和安全風險。他呼吁社會、技術和風險緩解策略共同發展,以謹慎而緩慢地采用這些工具。
不少網友已經體驗了ChatGPT Agent的功能,并分享了他們的感受。有網友表示,ChatGPT Agent在20分鐘內為他創建了一個完整的提前退休計劃,包括稅法分析、儲蓄計算和投資分配等,最終生成了一個可下載的演示文稿。雖然電子表格和幻燈片生成能力不錯,但也有網友指出,與其他工具相比,ChatGPT Agent在某些任務上的效率仍有提升空間。