OpenAI近日宣布了一項重大更新,為其AI聊天機器人ChatGPT引入了“智能體”功能。這一創新使ChatGPT能夠利用專屬的虛擬計算機,自主瀏覽網頁、深入研究、下載資料,并創建新文件。
具體而言,ChatGPT現在擁有了一個“虛擬個人電腦”,可登錄用戶賬戶,執行下載、發送內容等操作。OpenAI解釋,AI模型能選擇文本或視覺瀏覽器打開網頁,下載文件,通過終端運行命令處理數據,并通過視覺瀏覽器查看結果。這種自適應策略確保了任務的高效完成。
為了提升用戶體驗,ChatGPT智能體深度集成了第三方服務。用戶只需點擊聊天框中的“工具”按鈕,選擇“智能體模式”,即可啟用該功能。隨后,用戶用自然語言描述任務,智能體即可跨越網頁和本地應用環境執行操作,大大簡化了繁瑣流程。
ChatGPT智能體能夠連接Gmail、GitHub等應用,提取有用信息如電子郵件或代碼,并完成指定任務。它還能通過第三方API獲取信息,利用相關服務。若網站需登錄,用戶可通過安全瀏覽器視圖完成,使智能體執行更深入的任務,如檢查收件箱或填寫表單。
OpenAI的ChatGPT智能體產品負責人表示,該模型在基礎財務分析任務中表現出色,通常這類工作需要初級員工熬夜完成,特別是在緊急情況下。
此次推出的智能體是對2025年1月OpenAI推出的“Operator”智能體的改進和擴展。Operator雖允許ChatGPT瀏覽網頁、填寫表單等,但僅限于與網站和Web應用交互,無法與本地運行的程序如Excel或PPT軟件交互。而ChatGPT智能體不僅能瀏覽網站、與在線表單交互,還能運行代碼、分析數據,并根據用戶指示生成如PPT或Excel的輸出文件。
ChatGPT智能體結合了OpenAI之前發布的“Operator”和“深度研究”兩大智能體的優點。“深度研究”能通過專有文本瀏覽器進行深入網絡搜索,并編寫詳細報告。Operator無法進行深度分析或撰寫報告,而“深度研究”不能與網站交互細化結果或訪問需身份驗證的內容。因此,OpenAI將兩者優勢融為一體。
雖然原有的Operator工具將被淘汰,但用戶仍可通過ChatGPT界面下拉菜單訪問“深度研究”功能。ChatGPT智能體支持多種應用場景,如競爭分析、報告生成等,且能無縫切換不同工具。
ChatGPT智能體的推出還伴隨著嚴格的安全控制措施。鑒于智能體能代表用戶執行操作,OpenAI加強了安全保護,包括在操作前要求用戶確認、主動監督敏感任務,以及設置技術保障限制意外行為。
針對高風險領域,如生物與化學,ChatGPT智能體被歸類為“高能力系統”,并采取了最強的安全保護措施。這些措施包括拒絕訓練、由生物安全專家進行的“紅隊”測試和改進的檢測系統。
ChatGPT智能體的推出使OpenAI在某種程度上與微軟展開直接競爭。微軟也推出了類似AI智能體,幫助用戶創建和編輯PPT和Excel文件。盡管如此,ChatGPT智能體在實測中表現出色,如在“人類終極考試”中取得高分,在“SpreadsheetBench”基準測試中性能遠超Excel中的Copilot。
目前,ChatGPT智能體的部分功能仍在測試階段,可能在格式或應用內預覽和導出文件方面存在差異。OpenAI正積極訓練下一代版本,以提高功能的完善度和布局。
ChatGPT智能體的推出標志著用戶與AI互動方式的轉變,從單純提問到全權任務委托。憑借其強大的推理和執行能力,OpenAI相信用戶將越來越希望AI成為能夠解決實際問題的助手。