李飛飛創(chuàng)立的World Labs公司近日在空間智能領(lǐng)域取得突破性進展,其研發(fā)的世界模型可基于單張圖像或文字提示生成具備持久性的3D虛擬環(huán)境。該模型突破了傳統(tǒng)生成式AI的時空限制,用戶不僅能自由探索無邊界的虛擬空間,更可將多個獨立場景無縫拼接,構(gòu)建出規(guī)模宏大的數(shù)字世界。
與谷歌Genie等同類模型相比,該技術(shù)最大亮點在于其"永久存在"特性。生成的3D世界支持隨時訪問、永久保存,用戶可創(chuàng)建專屬鏈接實現(xiàn)跨設(shè)備共享。更令人矚目的是其幾何結(jié)構(gòu)的精準度——通過先進的空間推理算法,系統(tǒng)能精準還原畫面背后的隱藏空間,使虛擬環(huán)境具備完整的三維結(jié)構(gòu)。
在視覺風格方面,模型展現(xiàn)出驚人的適應(yīng)性。從賽博朋克風格的未來都市到海綿寶寶式的卡通世界,系統(tǒng)能將扁平化插畫、寫實照片等多元輸入轉(zhuǎn)化為風格統(tǒng)一的3D場景。這種自由迭代特性為影視制作、游戲開發(fā)等領(lǐng)域帶來全新可能,創(chuàng)作者可通過持續(xù)調(diào)整找到最理想的視覺呈現(xiàn)。
技術(shù)實現(xiàn)層面,團隊開發(fā)了獨特的空間擴展機制。通過保持場景間的風格一致性與幾何連貫性,用戶可像拼接樂高積木般組合多個場景,構(gòu)建出城市級規(guī)模的虛擬環(huán)境。這種模塊化設(shè)計不僅降低了創(chuàng)作門檻,更使大規(guī)模虛擬世界的構(gòu)建成為可能。
目前該技術(shù)已通過Marble平臺開放beta測試,用戶可免費體驗3D世界生成功能。系統(tǒng)支持將生成內(nèi)容導出為高斯點云格式,借助開源的Spark渲染庫,這些數(shù)據(jù)可無縫集成至Three.js框架,實現(xiàn)在網(wǎng)頁端、移動設(shè)備及VR設(shè)備的跨平臺渲染。
早期測試者反饋顯示,該模型在場景連貫性、細節(jié)豐富度等方面表現(xiàn)優(yōu)異。有建筑設(shè)計師表示,通過輸入手繪草圖生成的3D模型,其空間結(jié)構(gòu)精準度遠超預(yù)期;游戲開發(fā)者則看重其風格自定義功能,認為這將極大提升原型開發(fā)效率。