據《金融時報》披露,埃隆·馬斯克旗下人工智能企業(yè)xAI正全力投入世界模型的研發(fā),與meta、谷歌等科技巨頭在構建能夠理解并模擬物理環(huán)境的人工智能系統(tǒng)領域展開激烈角逐。這種技術突破或將使AI的應用范圍從純數字領域擴展至現(xiàn)實世界。
為加速技術落地,xAI今年夏季從英偉達引入兩位頂尖研究員——澤山·帕特爾(Zeeshan Patel)和伊桑·何(Ethan He)。這兩位專家在物理環(huán)境模擬領域擁有深厚積累,而英偉達憑借其Omniverse平臺在該領域占據領先地位。知情人士透露,xAI的世界模型項目不僅聚焦游戲領域,旨在生成高度交互的3D環(huán)境,還計劃應用于機器人控制系統(tǒng)。
與傳統(tǒng)依賴文本訓練的大型語言模型不同,世界模型通過分析機器人采集的視頻數據和物理交互信息,構建對現(xiàn)實世界的動態(tài)理解。這種技術路徑可能催生新一代AI工具,其能力將遠超當前以ChatGPT為代表的文本生成系統(tǒng)。英偉達方面曾向《金融時報》表示,該技術的潛在市場規(guī)模可能接近全球經濟總量。
馬斯克在社交平臺X上確認,xAI計劃于2025年底前推出"革命性AI游戲",這與他去年公布的技術路線圖保持一致。與此同時,該公司本周發(fā)布了經過"重大升級"的圖像與視頻生成模型,并宣布向公眾免費開放使用。不同于OpenAI Sora等現(xiàn)有技術通過模式預測生成視頻幀,xAI的新模型被指具備對物理規(guī)律的因果推理能力。
為支撐技術發(fā)展,xAI正大規(guī)模招募專業(yè)人才。招聘崗位涵蓋圖像視頻生成工程師(年薪18萬至44萬美元)和視頻游戲導師(時薪45至100美元),后者將指導Grok系統(tǒng)開發(fā)AI輔助游戲設計工具。這些舉措顯示,xAI試圖通過構建"全模態(tài)AI團隊",實現(xiàn)文本、圖像、視頻和音頻的跨領域內容生成。
盡管技術前景廣闊,現(xiàn)實挑戰(zhàn)依然嚴峻。開發(fā)世界模型需要海量現(xiàn)實世界數據,而數據采集與標注成本高昂。游戲開發(fā)商Larian Studios發(fā)行主管邁克爾·杜斯本周在X平臺發(fā)文指出,AI無法解決行業(yè)"缺乏領導力與愿景"的核心問題,強調"需要更多值得玩家沉浸的虛擬世界,而非數學優(yōu)化的游戲循環(huán)"。
目前,谷歌、meta等科技公司也在推進類似研究,但尚未實現(xiàn)技術突破。xAI方面未對相關置評請求作出回應。這場關乎AI未來形態(tài)的技術競賽,正將人類對智能系統(tǒng)的想象推向新的維度。











