埃隆?馬斯克旗下的xAI公司正全力推進(jìn)“世界模型”的研發(fā)工作,試圖在下一代人工智能系統(tǒng)的競爭中與meta、谷歌等科技巨頭一較高下。這類新型AI系統(tǒng)具備自主理解和模擬物理環(huán)境的能力,被視為推動AI技術(shù)突破的關(guān)鍵方向。
根據(jù)英偉達(dá)的公開資料,世界模型屬于生成式AI范疇,能夠捕捉現(xiàn)實(shí)世界的動態(tài)特性,包括物理規(guī)律和空間關(guān)系。通過整合文字、圖像、視頻及動作數(shù)據(jù),這類模型可生成具有真實(shí)感的動態(tài)場景。與傳統(tǒng)大語言模型不同,世界模型通過分析視頻和機(jī)器人傳感器數(shù)據(jù),構(gòu)建對三維空間的認(rèn)知能力。
xAI公司近期從英偉達(dá)引入兩位核心研究人員——澤尚?帕特爾和何宜暉,二人均在世界模型領(lǐng)域擁有深厚經(jīng)驗(yàn)。英偉達(dá)憑借其Omniverse平臺在該技術(shù)領(lǐng)域保持領(lǐng)先,該平臺可創(chuàng)建并運(yùn)行高度逼真的虛擬環(huán)境。此次人才引進(jìn)顯示xAI正加速構(gòu)建技術(shù)壁壘,試圖在模型研發(fā)競賽中占據(jù)先機(jī)。
知情人士透露,xAI的世界模型項(xiàng)目包含兩大應(yīng)用方向:其一為游戲產(chǎn)業(yè)開發(fā)可交互的3D環(huán)境生成系統(tǒng),其二則瞄準(zhǔn)機(jī)器人AI領(lǐng)域。馬斯克在社交平臺公開表示,公司計(jì)劃在2025年底前推出“AI生成的優(yōu)質(zhì)游戲”,重申了去年設(shè)定的技術(shù)目標(biāo)。本周xAI還發(fā)布了經(jīng)過重大升級的圖像視頻生成模型,并宣布向用戶免費(fèi)開放。
與傳統(tǒng)視頻生成工具相比,世界模型展現(xiàn)出顯著技術(shù)優(yōu)勢。當(dāng)前OpenAI的Sora等模型通過預(yù)測訓(xùn)練數(shù)據(jù)中的模式逐幀生成內(nèi)容,而世界模型能實(shí)時解析物理世界的因果關(guān)系,精準(zhǔn)模擬物體在不同環(huán)境中的互動機(jī)制。這種能力突破使AI系統(tǒng)從單純的模式識別邁向?qū)ΜF(xiàn)實(shí)世界的深度理解。
盡管前景廣闊,世界模型的研發(fā)仍面臨重大挑戰(zhàn)。構(gòu)建足夠規(guī)模的現(xiàn)實(shí)世界模擬數(shù)據(jù)集既困難又昂貴,谷歌、meta等科技公司雖已投入資源,但尚未取得決定性突破。游戲行業(yè)對AI技術(shù)的應(yīng)用持謹(jǐn)慎態(tài)度,《博德之門3》開發(fā)商拉瑞安工作室的發(fā)行主管邁克爾?道斯公開指出,當(dāng)前游戲產(chǎn)業(yè)更需要創(chuàng)新的敘事呈現(xiàn)方式,而非算法生成的玩法循環(huán)。
英偉達(dá)此前向媒體表示,世界模型的市場潛力可能接近全球經(jīng)濟(jì)總量規(guī)模。隨著xAI、谷歌等公司持續(xù)加大投入,這場關(guān)乎AI未來形態(tài)的技術(shù)競賽正進(jìn)入關(guān)鍵階段。截至發(fā)稿,xAI及相關(guān)研究人員尚未對項(xiàng)目進(jìn)展作出正式回應(yīng)。











