人工智能領域再次迎來了一位重量級玩家的入局。斯坦福大學教授、知名AI科學家李飛飛于2024年創(chuàng)立了World Labs,這家初創(chuàng)公司正致力于開發(fā)具備“空間智能”的下一代AI系統(tǒng)。短短數(shù)月內(nèi),World Labs便完成了兩輪融資,累計籌集資金約2.3億美元,估值迅速飆升至10億美元以上,一躍成為AI領域的新晉獨角獸。
World Labs的背后,有著一系列頂尖科技與風投機構的支持,包括a16z、Radical Ventures、NEA、英偉達NVentures、AMD Ventures以及Intel Capital等。這些重量級玩家的加入,無疑為World Labs的發(fā)展注入了強大的動力。
在近期的一次A16Z訪談中,李飛飛首次公開闡述了World Labs的創(chuàng)立理念、研究方向以及她的宏大愿景。她表示,自己并不特別迷戀大語言模型,因為過去的法律工作經(jīng)歷讓她深刻意識到,僅憑說話和寫作,難以真正理解這個世界。她認為,AI正在邁向一個更高級的階段,即從語言模型向世界建模的轉變。未來的AI將不再僅僅依賴文字描述,而是能夠真正“看到”、“理解”和“重建”三維空間。
李飛飛強調(diào),人類之所以聰明,不僅因為我們會說話,更重要的是我們會“看”、會“動”、會“操作”這個三維世界。她以DNA的雙螺旋結構和富勒烯分子為例,指出這些典型的三維結構僅憑文字難以想象,必須依靠空間上的建模才能真正理解。因此,語言模型雖然重要,但它只是壓縮過的信息版本,遠遠不能代表真實世界的全貌。真正的智能,必須能夠理解和構建這個三維世界。
那么,世界模型為何如此重要?李飛飛將其解釋為AI對現(xiàn)實世界的三維理解能力。她指出,就像人類一樣,AI也需要會說話、會思考、會看、會動、能感知這個世界的空間結構。AI的世界模型,正是試圖將視覺、空間感、動作等多個維度的信息結合起來,真正模擬出一個接近真實的世界。她以游戲場景生成為例,形象地說明了AI世界模型的工作原理。
在談到技術實現(xiàn)時,李飛飛表示,要讓AI真正理解、重構三維世界,是一個非常復雜的過程。目前,有幾個關鍵的技術方向正在被重點探索,包括從二維圖像到三維重建的能力、高斯平面表示法、擴散模型以及多視角的數(shù)據(jù)融合等。這些技術共同構成了AI空間感知能力的基礎。
李飛飛還分享了一個親身經(jīng)歷,五年前因角膜受傷而失去立體視覺的經(jīng)歷讓她深刻體會到人類對空間感的依賴。這也讓她更加確信,AI如果沒有這種空間理解能力,就只能停留在“看得見”但“看不懂”的階段。因此,世界模型是AI實現(xiàn)“通用智能”的關鍵一步。
在談到應用場景時,李飛飛表示,世界模型的應用場景遠比想象得多。在游戲行業(yè),AI可以根據(jù)幾張照片或一段視頻自動生成逼真的三維世界;在建筑行業(yè),AI可以在幾分鐘內(nèi)生成整個空間的立體結構,甚至模擬陽光從不同角度照射的效果;在機器人領域,具備三維視覺的機器人才能真正理解環(huán)境,實現(xiàn)自由行動;數(shù)字孿生、創(chuàng)意產(chǎn)業(yè)等領域也都在積極探索世界模型的應用。
然而,盡管世界模型的應用前景廣闊,但目前仍面臨諸多挑戰(zhàn)。李飛飛指出,數(shù)據(jù)、算力和泛化能力是三大關鍵問題。要讓AI理解三維世界,必須提供足夠清晰、全面的數(shù)據(jù);同時,現(xiàn)有的很多技術對計算資源的要求非常高,難以大規(guī)模落地應用;AI還需要更強的適應性,才能在不同環(huán)境中都能表現(xiàn)出色。
面對這些挑戰(zhàn),李飛飛表示,World Labs正致力于構建一個融合多種能力的團隊,包括計算機視覺專家、圖形學研究者、擴散模型開發(fā)者以及做物理仿真和機器人控制的人才等。她認為,未來的AI研究范式將從“單一學科”走向“多學科融合”,從“個體英雄”走向“集體智慧”。
在談到AI與人文、教育、法律等社會系統(tǒng)的關系時,李飛飛表示,真正決定AI能走多遠、走多穩(wěn)的,不只是技術,還有它和社會之間的關系。她認為,未來的AI教育應該更注重培養(yǎng)學生的批判性思維和社會責任感;同時,也必須為AI設計好規(guī)則邊界,以避免出現(xiàn)無法挽回的錯誤。
最后,李飛飛分享了World Labs的愿景。她相信,未來的AI將不僅“看得到”,還要“看得懂”;不僅“重建世界”,還要“參與世界”;不僅“執(zhí)行任務”,還要“與人協(xié)作”。AI的終極目標不是替代人類,而是成為人類在物理世界中的智能延伸。她以眼鏡、輪椅等輔助工具為例,形象地說明了AI將如何成為我們理解和操作這個世界的新工具。
在李飛飛的描繪中,一個AI更懂人、更貼近現(xiàn)實、更能與我們一起生活和工作的時代正在到來。盡管實現(xiàn)這一目標并不容易,但World Labs正攜手行業(yè)伙伴,共同探索這條充滿挑戰(zhàn)與機遇的道路。