在科技界的激烈競爭中,OpenAI近期推出了一款名為ChatGPT Agent的新型智能體應用,以此回應近期的人才流失問題。這款應用據稱基于o3模型家族,并融合了Deep Research和Operator的優勢功能,能夠進行多步推理和與瀏覽器交互執行任務。在OpenAI的內部基準測試中,ChatGPT Agent展現出了超越現有模型的強大性能,尤其在解決跨學科專家級任務方面。
ChatGPT Agent的發布正值OpenAI遭遇關鍵人才流失之際,幾位頂尖開發者在發布會前夕選擇離職,加入了meta。這些開發者曾負責打造o系列推理模型與智能體,他們的離開無疑對OpenAI構成了不小的打擊。然而,OpenAI表示,他們為ChatGPT Agent開發了全新的模型,該模型通過端到端的強化學習訓練而來,并圍繞“高性能”進行了優化。
在OpenAI提供的測試中,ChatGPT Agent在“人類最后考試”中的表現尤為亮眼,其勝率遠超同族模型o3和Deep Research。在模擬復雜真實任務的測試中,ChatGPT Agent的表現也接近人類水平,優于其他同類模型。這一系列優異的表現,使得OpenAI首席執行官奧特曼聲稱從中“感受到了AGI(通用人工智能)”的潛力。
然而,隨著硅谷巨頭們紛紛宣布接近或已實現AGI,這一概念在商業敘事中似乎已失去了其原有的純粹性。一些研究者指出,硅谷巨頭們對AGI的表述更多是一種營銷手段,旨在緩解大模型變現和應用規模落地的壓力。與此同時,真正的AI研究者們仍在堅守信仰,探索技術的邊界。
值得注意的是,離開OpenAI的開發者之一Jason Wei,在離職當天提出了驗證者定律的框架,用于預測未來AI的能力邊界。他認為,一個任務被AI攻克的難易程度,取決于驗證結果的容易程度,而非解決任務本身的難度。這一觀點為理解AI的發展提供了新的視角。
面對人才流失和競爭壓力,OpenAI選擇通過不斷創新和迭代模型性能來鞏固其市場地位。與此同時,meta則通過大規模收購和人才引進,加速其在AI領域的布局。meta在俄亥俄州和路易斯安那州打造的超級算力集群,預示著其未來在AI研究方面的雄心壯志。
盡管硅谷巨頭們對AGI的表述存在差異,但不可否認的是,AI技術正在以前所未有的速度發展。ChatGPT Agent的推出,不僅展示了OpenAI在AI領域的深厚實力,也為整個行業帶來了新的思考。隨著用戶與AI交互方式的轉變,AGI的落地似乎已不再遙不可及。