meta公司近日宣布推出一項名為WorldGen的前沿技術(shù),這項端到端系統(tǒng)能夠僅通過文本描述,自動構(gòu)建出具備交互性和導(dǎo)航功能的三維虛擬世界。用戶不僅可以在其中獲得沉浸式體驗,還能自由探索這些由算法生成的數(shù)字空間,為游戲開發(fā)、虛擬仿真和社交互動開辟了全新可能性。
該系統(tǒng)的核心技術(shù)融合了程序化邏輯推理、基于擴散模型的三維生成算法,以及面向?qū)ο蟮膱鼍胺纸饪蚣堋Mㄟ^這種多技術(shù)協(xié)同的方式,WorldGen能夠生成幾何結(jié)構(gòu)精確、視覺效果細(xì)膩且渲染效率優(yōu)異的三維場景。這些場景不僅適用于游戲開發(fā),還能為工業(yè)仿真、沉浸式社交等場景提供基礎(chǔ)支持,其輸出結(jié)果可直接導(dǎo)入Unity、Unreal等主流游戲引擎,無需額外適配或修改渲染流程。
在三維內(nèi)容生成領(lǐng)域,近年來基于文本或圖像生成高質(zhì)量數(shù)字資產(chǎn)的技術(shù)已取得突破性進(jìn)展。但現(xiàn)有方法普遍存在視角依賴問題——多數(shù)系統(tǒng)僅能從單一視角向外擴展構(gòu)建場景,導(dǎo)致用戶稍微移動后,模型質(zhì)量便出現(xiàn)明顯下降。WorldGen則突破了這一局限,其生成的場景覆蓋50米×50米范圍,在保持整體風(fēng)格和幾何結(jié)構(gòu)一致性的同時,支持用戶在該空間內(nèi)自由移動。meta團隊透露,未來計劃進(jìn)一步擴大可生成場景的規(guī)模。
盡管這項技術(shù)已展現(xiàn)出顯著優(yōu)勢,但目前仍處于實驗室研究階段,尚未向開發(fā)者開放使用。研發(fā)團隊承認(rèn),當(dāng)前版本仍存在生成延遲較高、空間范圍受限等不足,后續(xù)將重點優(yōu)化這些性能指標(biāo)。不過其技術(shù)架構(gòu)已展現(xiàn)出強大潛力,特別是在需要快速構(gòu)建大規(guī)模虛擬環(huán)境的場景中,WorldGen可能成為改變行業(yè)規(guī)則的關(guān)鍵工具。
值得注意的是,WorldGen的生成過程完全依賴文本輸入,用戶無需掌握專業(yè)建模技能或提供參考圖像。這種"所想即所得"的創(chuàng)作方式,可能徹底改變?nèi)S內(nèi)容生產(chǎn)流程。隨著技術(shù)不斷完善,未來或許能實現(xiàn)從概念描述到完整虛擬世界的全自動轉(zhuǎn)化,為元宇宙、數(shù)字孿生等領(lǐng)域提供基礎(chǔ)設(shè)施級支持。











