科技圈又迎來一則重磅消息:馬斯克旗下的xAI正式進軍世界模型領域。這一動作瞬間引發行業關注,meta、Google DeepMind等科技巨頭或許都在思考,xAI此舉是否會對自己形成直接挑戰。
據《金融時報》報道,為在世界模型這場激烈競爭中占據優勢,今年夏季,xAI成功從英偉達挖來多名資深研究員。這一舉措無疑為xAI注入強大技術動力,也顯示出其布局世界模型的決心。
就在xAI悄然布局世界模型后不久,馬斯克在社交平臺上再次提及去年定下的目標:到2026年底,xAI將推出一款極具影響力的AI生成游戲。這一目標引發外界廣泛猜測,xAI的世界模型戰略究竟與這款游戲有何關聯。
世界模型近兩年成為全球AI巨頭和實驗室競相角逐的新領域。Google DeepMind、meta、NVIDIA以及李飛飛團隊等都在積極投入研發。如今,xAI的加入讓這場競爭愈發激烈。
xAI入局后的第一步,便是從英偉達“挖角”。今年夏天,xAI至少引入兩位來自英偉達的研究人員:Zeeshan Patel和Ethan He。Zeeshan Patel今年5月剛從UC伯克利碩士畢業,研究領域集中在深度學習、生成模型和物理人工智能。加入xAI前,他曾在蘋果AI/ML部門從事基礎模型研究,之后進入英偉達研究院專注生成式世界模型研究,期間主要研發大規模多模態模型與訓練框架。
Ethan He本科畢業于西安交通大學,隨后前往CMU攻讀計算機視覺碩士學位,并以優異成績畢業。其Google Scholar被引數達8495。2019年至2021年,他在Facebook AI擔任研究工程師,負責大規模視頻自監督學習、視頻基礎模型等工作。2023年加入英偉達后,他的研究聚焦于MoE模型、多模態模型和世界模型,并于今年7月正式加入xAI。
這兩位研究員有一個共同點:都曾參與英偉達Omniverse平臺的核心開發工作。Omniverse是全球最成熟的仿真平臺之一,被稱為“通往物理世界的數字平行宇宙”。它作為英偉達打造的物理一致性仿真系統,廣泛應用于機器人訓練、3D建模、數字孿生、自動駕駛等領域,能夠在虛擬世界中精準模擬現實物理規律,讓AI在不接觸現實的情況下學會與世界互動。這種能力正是世界模型研發所急需的。
有xAI內部人士透露,馬斯克計劃將英偉達在圖形與物理模擬領域的技術積累,應用到xAI的世界模型體系中。這一計劃若能實現,將為xAI的世界模型發展提供有力支持。
“世界模型”概念最早源于強化學習,旨在讓AI在腦海中構建一個虛擬世界,用于規劃行動和預測結果。如今,它被不少業內人士視為實現通用人工智能(AGI)的核心基礎。AI教母李飛飛認為,世界模型應源自人類對世界的自然認知,是一種能讓AI真正理解和推理物理3D世界的模型,而不僅限于文本處理。它能讓AI理解3D結構、形狀和組合性,從而推動機器人技術、創意產業和計算的未來發展,還能生成和重建持久存在、可導航的3D環境,支持多種應用,構建更大規模的虛擬世界和多元宇宙。
過去一年,這一方向成為AI巨頭和實驗室的競爭焦點。DeepMind推出Genie 3,能從圖片或文字生成可交互的2D游戲世界;meta發布V-JEPA-2,讓模型在視頻中預測未來幀、理解物理因果;英偉達也在強化自身世界模型,用于機器人訓練與數字孿生。
那么,xAI入局世界模型究竟有何意圖?據知情人士透露,xAI的首批應用可能聚焦于電子游戲領域。目前,團隊正嘗試讓AI自動生成自適應、逼真的3D場景,這些場景能根據玩家行為實時變化。這與馬斯克設定的2026年底推出AI生成游戲的目標高度契合。
有用戶在社交平臺留言稱:“AI在游戲開發中效率極高,能激發無限創造力,這一方向很有前景。”與此同時,xAI內部正在組建一支全模態團隊,專門研究圖像、視頻、音頻的綜合理解與生成。近期公開的招聘信息顯示,該團隊涵蓋多個方向:音頻理解、生成與評測的技術人員,年薪區間18萬-44萬美元,側重多模態建模與數據系統的人員。還有一個職位引發行業熱議——電子游戲導師,時薪45-100美元,負責向模型講解電子游戲機制、敘事邏輯和任務設計。這表明,馬斯克希望借助人類專家的經驗,讓模型學會玩游戲、設計任務和構建可交互世界。
馬斯克曾多次公開表示,xAI的使命是“讓AI理解宇宙的本質”。世界模型正是實現這一目標的關鍵路徑。擁有世界模型后,AI不僅能生成內容,還能在內部模擬出一個真實世界的副本。這意味著它既能驅動AI游戲,也能應用于智能體、自動駕駛乃至具身智能機器人。
從這一角度看,xAI、特斯拉、Neuralink之間的關系變得愈發緊密。xAI負責研發模型,特斯拉擁有機器人和自動駕駛數據,Neuralink提供腦機接口作為社交與實時反饋平臺。若這些板塊能通過世界模型實現互通,馬斯克的AI帝國將形成一個完整的閉環。











