卡帕西對當前業界熱議的“智能體元年”概念提出冷靜判斷。他指出,盡管Claude、Codex等工具已展現出實用價值,但現有智能體仍存在認知缺陷,缺乏持續學習能力,且無法自主操作復雜系統。基于十五年行業經驗,他預測智能體技術需要至少十年持續研究才能實現真正可用性,未來十年將是“智能體的十年”。
關于AGI實現時間,卡帕西結合技術發展規律給出十年預測。他觀察到行業存在過早追求完整智能體的傾向,而忽視了基礎技術棧的完善。通過復現1989年卷積神經網絡實驗,他發現算法改進雖能提升性能,但數據規模、計算能力和軟件系統的協同發展同樣關鍵,這種多要素協同模式將持續影響AGI進程。
在AI架構演進方面,卡帕西認為未來十年核心機制仍將圍繞神經網絡展開。他以“時間平移不變性”理論解釋技術迭代規律:從卷積網絡到Transformer的演進,本質都是前向傳播與梯度下降的變體。盡管具體形態可能變化,但超大模型的訓練范式和核心機制將保持延續性。
針對大模型認知局限,卡帕西以自身開發nanochat的經歷為例,指出當前模型在處理復雜編碼任務時仍顯不足。他將開發者與代碼的交互模式分為三類:完全手寫、手寫配合自動補全、完全依賴智能體生成。實驗表明,在需要深度思考的場景中,第二類模式仍是最優選擇,這反映出模型在處理“智力密集型任務”時的根本性局限。
在AI學習機制討論中,卡帕西對比了強化學習與傳統監督學習的差異。他承認強化學習存在獎勵分配困難、對抗樣本脆弱等問題,但強調其相比單純模仿人類行為具有突破性。針對模型自我評估的不可靠性,他提出需要引入元學習或合成數據機制,不過目前尚未有實驗室實現通用環境下的有效應用。
對于人類與AI的學習差異,卡帕西以夢境為例,指出人類通過反思、討論等多元方式整合知識,而當前模型僅依賴預測下一個詞的學習方式存在本質缺陷。他特別提到互聯網訓練數據的噪聲問題,認為真正重要的智能發展在于認知能力而非記憶容量,這解釋了為何構建超大模型壓縮記憶并非最優路徑。
在AI社會影響層面,卡帕西以醫療影像診斷為例,指出即便計算機視覺技術成熟,放射科醫生的工作仍包含患者溝通等復雜場景。他提出更現實的AI應用模式是完成80%常規工作,剩余20%關鍵任務交由人類監督。這種人機協作模式,在呼叫中心等場景已顯現出可行性。
關于超級智能(ASI),卡帕西將其視為自動化進程的自然延伸。他警告當世界運行依賴于計算機集群時,人類可能逐漸喪失對系統的理解能力。不過他同時指出,這種遞歸式自我改進從工業革命開始已持續數百年,所謂“智能爆炸”本質上是自動化程度的持續深化。











