近日,AI領(lǐng)域掀起一場關(guān)于技術(shù)路線的激烈討論,焦點人物正是被譽為“AI教父”的圖靈獎得主楊立昆。這位meta首席AI科學(xué)家被曝正在籌備離職創(chuàng)業(yè),其目標直指當前硅谷主流的大語言模型(LLM),轉(zhuǎn)而推動一種全新的“世界模型”架構(gòu)。這一舉動被業(yè)界視為對現(xiàn)有AI發(fā)展路徑的重大挑戰(zhàn),甚至可能引發(fā)行業(yè)格局的深刻變革。
楊立昆長期主張的“世界模型”與傳統(tǒng)LLM形成鮮明對比。他指出,當前主流的LLM如同“文字專家”,通過海量文本數(shù)據(jù)訓(xùn)練,擅長語言生成與模式識別,卻缺乏對物理世界的真實理解。例如,當被要求想象一個立方體旋轉(zhuǎn)90度后的形態(tài)時,LLM因缺乏空間推理能力而無法完成。相比之下,楊立昆設(shè)想的“世界模型”將通過圖像、視頻和空間數(shù)據(jù)感知環(huán)境,不僅能夠?qū)崟r估計世界狀態(tài),還能預(yù)測動作后的因果結(jié)果,從而賦予AI真正的規(guī)劃與推理能力。
“我家那只貓的智能都遠超現(xiàn)有LLM。”楊立昆曾用這句尖銳的比喻,直指當前技術(shù)路線在常識與因果理解上的短板。他強調(diào),動物通過觀察與行動迅速構(gòu)建因果模型,而LLM僅依賴統(tǒng)計關(guān)聯(lián),無法形成對世界的深層認知。在他看來,無限擴展算力與數(shù)據(jù)只會讓LLM成為“記憶力超群的復(fù)讀機”,而非通往通用人工智能(AGI)的橋梁。
這場理念之爭的背后,是楊立昆與meta戰(zhàn)略方向的深刻分歧。隨著公司全面轉(zhuǎn)向LLM開發(fā),這位65歲的科學(xué)家逐漸被邊緣化。2018年,他卸任管理職務(wù),轉(zhuǎn)任“個體貢獻者”,不再參與核心項目如開源大模型Llama的研發(fā)。今年夏天,年僅28歲的Scale AI創(chuàng)始人汪滔被任命為meta首席AI官,直接成為楊立昆的上級,而另一位年輕科學(xué)家趙晟佳的加入,進一步加劇了權(quán)力結(jié)構(gòu)的變動。AI部門裁員與資源縮減的消息,也加速了楊立昆的離場決心。
楊立昆的職業(yè)生涯始終充滿“叛逆”色彩。早在機器學(xué)習(xí)尚屬冷門領(lǐng)域時,他便將其作為博士研究方向;在貝爾實驗室期間,他參與開發(fā)了銀行廣泛使用的手寫識別技術(shù);2013年,受扎克伯格邀請,他領(lǐng)導(dǎo)meta基礎(chǔ)AI研究實驗室(FAIR),并于2018年與杰弗里·辛頓、約書亞·本吉奧共同斬獲圖靈獎。如今,他再次以“孤獨先知”的姿態(tài),挑戰(zhàn)行業(yè)共識,試圖為AI發(fā)展開辟新路徑。
值得注意的是,楊立昆的探索并非孤立無援。AI領(lǐng)域另一位頂尖學(xué)者、ImageNet創(chuàng)造者李飛飛,近期也通過新公司W(wǎng)orld Labs推出模型Marble,該模型能夠理解并生成3D環(huán)境,與“世界模型”理念不謀而合。李飛飛曾公開表示,未來需超越Transformer架構(gòu)探索新模型,這與楊立昆的呼吁形成呼應(yīng)。兩位權(quán)威學(xué)者的共識,或許預(yù)示著AI行業(yè)即將從LLM的“狂歡”中抽身,轉(zhuǎn)向更深層次的范式革新。
楊立昆的創(chuàng)業(yè)計劃尚未公布具體細節(jié),但已引發(fā)廣泛關(guān)注。支持者認為,他的“世界模型”可能破解當前AI在物理世界交互中的瓶頸;質(zhì)疑者則擔憂,這一路線是否具備技術(shù)可行性,或是否會因過于超前而難以落地。無論如何,這場由“AI教父”發(fā)起的挑戰(zhàn),已為行業(yè)注入新的變量,其結(jié)果或?qū)⒅匦露x人工智能的未來方向。

















