meta前首席AI科學(xué)家楊立昆近日公開表示,當(dāng)前科技巨頭對大型語言模型(LLM)的過度投入可能偏離了實現(xiàn)通用人工智能的正確路徑。他在訪談中指出,這類模型本質(zhì)上依賴統(tǒng)計規(guī)律完成文本生成任務(wù),缺乏對物理世界的真實理解,更不具備人類級別的推理與規(guī)劃能力。這種技術(shù)路線雖能實現(xiàn)特定場景的文本交互,但距離真正的智能系統(tǒng)仍有本質(zhì)差距。
針對未來發(fā)展方向,楊立昆提出"世界模型"框架作為突破口。該理論認為,智能系統(tǒng)需要整合視覺、聽覺等多模態(tài)數(shù)據(jù),構(gòu)建對環(huán)境動態(tài)變化的模擬能力。通過這種機制,機器可逐步形成空間感知、時間序列理解及因果推理等基礎(chǔ)認知能力,類似人類嬰兒的學(xué)習(xí)過程。據(jù)透露,meta內(nèi)部已啟動相關(guān)項目,計劃利用十億小時視頻數(shù)據(jù)訓(xùn)練模型,目標(biāo)在2026年推出可執(zhí)行復(fù)雜虛擬任務(wù)的系統(tǒng)原型,并與增強現(xiàn)實設(shè)備形成技術(shù)協(xié)同。
meta官方回應(yīng)稱,現(xiàn)有語言模型仍是短期產(chǎn)品重點,但公司已同步加大世界模型與具身智能的研發(fā)投入。行業(yè)觀察人士分析,這項技術(shù)若取得實質(zhì)進展,可能為自動駕駛、智能機器人等領(lǐng)域提供全新解決方案。不過,數(shù)據(jù)獲取的合規(guī)性、算力資源的可持續(xù)性,以及模型決策的可解釋性,仍是制約技術(shù)落地的關(guān)鍵挑戰(zhàn)。當(dāng)前學(xué)術(shù)界對世界模型的研究尚處早期階段,其商業(yè)化路徑仍需持續(xù)探索。
這場技術(shù)路線之爭折射出人工智能領(lǐng)域的深層變革。傳統(tǒng)語言模型通過海量文本訓(xùn)練獲得的表面能力,正面臨理論瓶頸的質(zhì)疑。而強調(diào)環(huán)境交互與物理理解的新范式,雖然更具發(fā)展?jié)摿Γ枰黄茢?shù)據(jù)、算法與硬件的多重限制。科技企業(yè)如何在短期商業(yè)需求與長期技術(shù)布局間取得平衡,將成為決定未來競爭格局的重要因素。








