人工智能領域迎來了又一重大突破,OpenAI公司近期正式推出了其創新的ChatGPT智能體系統,這一消息在科技界引起了廣泛關注。OpenAI的首席執行官山姆·奧特曼攜手四位核心成員,通過一場長達25分鐘的直播,向全球觀眾展示了這一劃時代的技術成果。
ChatGPT智能體系統并非簡單的技術疊加,而是將Operator遠程瀏覽器的強大執行能力、Deep Research網絡信息整合的精準度,以及ChatGPT對話系統的流暢性完美融合,形成了一個既能思考又能行動的統一智能體平臺。這一平臺能夠主動從廣泛的代理技能中做出選擇,利用內置的計算機資源,為用戶執行各種復雜任務。
奧特曼在直播中強調,智能體系統的推出標志著AI系統能力達到了一個全新的高度。它不僅繼承了前輩技術的優勢,更在此基礎上實現了質的飛躍。
在詳細介紹中,我們了解到,Operator和Deep Research雖各有千秋,卻始終存在局限性。Operator擅長在網頁上處理內容,卻難以進行深入的文本分析或撰寫詳盡報告;而Deep Research在信息整合方面表現出色,卻無法與網站互動,優化搜索結果或訪問受保護的內容。OpenAI此次的創新之舉,正是將這兩者的優勢巧妙結合,打造出了一款功能更為強大的智能體。
在Agent模式下,ChatGPT能夠利用自己的“虛擬電腦”執行用戶指令,處理復雜的工作流程。用戶不僅可以與網站進行互動,還能在同一聊天窗口中直接從對話過渡到具體操作請求。這一功能的實現,極大地提升了用戶體驗和工作效率。
在發布會上,OpenAI展示了ChatGPT智能體在執行多項任務時的出色表現,如購買西裝、制作貼紙、預訂酒店等。智能體在啟動虛擬電腦后,會迅速詢問用戶的具體需求,并根據需求進行網頁瀏覽、商品挑選等操作。它甚至能夠滑動網頁、查看商品詳情,并留下專業的建議文字。智能體還能代替用戶完成下單等關鍵步驟。
ChatGPT智能體在“虛擬電腦”中執行任務時,能夠保留任務所需的上下文信息。它可以根據需要選擇使用文本瀏覽器或可視化瀏覽器打開頁面,從網絡上下載文件,并在終端中運行命令進行操作。同時,智能體在執行重要操作前會征求用戶權限,確保用戶對整個過程的掌控力。用戶可以隨時中斷、控制瀏覽器或停止任務,并可以安排已完成的任務自動重復執行。
在性能評估方面,ChatGPT智能體也展現出了卓越的實力。在“人類最后一次考試”評估中,智能體模型的SOTA得分達到了41.6,而在采用簡單的并行部署策略進行擴展后,得分更是提升至44.4。在FrontierMath等基準測試中,ChatGPT智能體的準確率也遠超之前的模型。
目前,ChatGPT智能體的Agent模式已向Pro、Plus和Team用戶開放。企業版和教育版用戶也將在未來幾周內獲得訪問權限。為了滿足不同用戶的需求,OpenAI為Pro用戶提供了每月400次的使用次數,而其他付費用戶則享有每月40次的使用次數。當然,用戶也可以通過額外付費獲得更多使用次數。