埃隆·馬斯克旗下的人工智能企業xAI正式宣布進軍世界模型研發領域,與meta、谷歌等科技巨頭展開直接競爭。該公司的核心目標是開發能夠深度理解物理規律、自主設計并導航復雜環境的下一代AI系統,這一戰略被視為突破當前文本生成技術邊界的關鍵嘗試。
為實現技術突破,xAI已從英偉達招募多名頂尖研究員,其中包括在世界模型領域具有深厚積累的Zeeshan Patel和Ethan He。這兩位專家此前參與的英偉達Omniverse平臺開發,正是通過模擬環境訓練AI理解真實世界的標桿項目。據內部人士透露,xAI的研發方向將聚焦于構建可生成交互式3D環境的模型,初期應用場景鎖定在游戲開發領域,未來計劃延伸至機器人控制系統。
馬斯克在近期訪談中透露,xAI計劃在2026年底前推出"具有劃時代意義的人工智能生成游戲"。為支撐這一目標,公司正在組建名為"omni team"的跨模態技術團隊,該團隊將突破傳統文本處理框架,實現圖像、視頻、音頻的協同生成。目前公開的招聘崗位顯示,核心技術職位年薪區間達18萬至44萬美元,同時設有專門訓練AI游戲設計系統的"視頻游戲導師"職位,時薪45至100美元。
與傳統視頻生成模型相比,世界模型的技術路徑存在本質差異。以OpenAI的Sora為代表的現有技術,主要通過模式識別生成視頻幀;而世界模型需要建立對物理因果關系的深度理解,能夠實時模擬物體在不同環境中的動態交互。這種技術躍遷被行業視為開啟AI實體化應用的關鍵,英偉達此前向《金融時報》分析稱,該領域的市場潛力可能達到全球經濟總量規模。
盡管技術前景備受期待,但世界模型的開發仍面臨重大挑戰。真實世界數據的采集與標注成本高昂,模擬環境的復雜性遠超現有訓練框架。游戲產業資深人士對此持審慎態度,《博德之門3》發行主管Michael Douse指出,當前行業更需要的是具有創造力的世界觀設計,而非單純依賴數學模型生成的游戲循環。這種觀點反映出技術落地過程中可能存在的產業認知差異。
目前xAI的研發進程已進入實操階段,其構建的模型正在通過視頻數據和機器人操作記錄進行訓練。這種多模態學習方式被認為能夠更真實地還原物理世界運行規律,但如何平衡技術可行性與商業應用價值,仍將是決定項目成敗的關鍵因素。











