日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

DeepMind Genie2:重塑3D交互環(huán)境,開啟AI新世界大門

   時間:2025-04-30 09:41:28 來源:ITBEAR編輯:快訊團隊 發(fā)表評論無障礙通道

在科技界引發(fā)廣泛關(guān)注的最新消息中,谷歌旗下的DeepMind人工智能研究實驗室通過CBS知名欄目《60分鐘》向公眾展示了其最新研發(fā)的AI模型——Genie2。這一突破性技術(shù)能夠?qū)我坏膱D像或簡單文本描述轉(zhuǎn)化為高度精細的3D交互式環(huán)境,為機器人訓(xùn)練、虛擬世界的構(gòu)建乃至通用人工智能(AGI)的發(fā)展開辟了全新的道路。

據(jù)深入了解,Genie2的核心優(yōu)勢在于其端到端的3D環(huán)境生成能力。用戶只需提供一張靜態(tài)圖片,比如瀑布的風(fēng)景照,或者輸入一段文字描述,如“雪地中的戰(zhàn)士”,Genie2就能自動生成一個可自由探索的3D交互環(huán)境,且無需人工參與設(shè)計。這一特性使得Genie2在技術(shù)的創(chuàng)新性上得到了廣泛認可,并在社交平臺上引發(fā)了熱烈討論。

更為引人注目的是,Genie2所生成的3D環(huán)境不僅高度逼真,還支持物理模擬,如重力、水流和煙霧效果,以及動態(tài)光影和角色動畫。用戶或AI代理可以通過鍵盤和鼠標(biāo)在環(huán)境中進行跳躍、游泳等互動操作,體驗極為真實。Genie2還具備環(huán)境一致性功能,能夠記住未顯示的場景部分,如轉(zhuǎn)角后的地形,生成時長可達10至60秒,多數(shù)示例在10至20秒之間。

在技術(shù)上,Genie2基于DeepMind的Gemini架構(gòu)和大規(guī)模視頻數(shù)據(jù)集,結(jié)合了先進的生成技術(shù)。其核心技術(shù)包括時空視頻分詞器、自回歸動態(tài)模型、潛在動作模型等。這些技術(shù)共同作用于Genie2,使其能夠逐幀生成視頻,根據(jù)用戶操作和先前幀預(yù)測后續(xù)場景,確保環(huán)境的連貫性。同時,通過無監(jiān)督學(xué)習(xí)從視頻中提取可控動作,支持交互性,并利用未標(biāo)注的互聯(lián)網(wǎng)視頻數(shù)據(jù)集訓(xùn)練模型理解物理、材質(zhì)和光影,生成多樣化的3D世界。

在應(yīng)用方面,Genie2的多樣化功能使其在多個領(lǐng)域展現(xiàn)出廣闊的應(yīng)用前景。在游戲開發(fā)領(lǐng)域,Genie2能夠快速將概念藝術(shù)或草圖轉(zhuǎn)化為可玩3D環(huán)境,大大縮短了原型設(shè)計時間,對獨立開發(fā)者和AAA游戲工作室來說無疑是一個巨大的福音。在虛擬現(xiàn)實與數(shù)字藝術(shù)領(lǐng)域,Genie2能夠生成沉浸式的VR場景或交互式藝術(shù)作品,提升用戶體驗;在機器人訓(xùn)練方面,Genie2為AI代理提供多樣化的3D訓(xùn)練環(huán)境,模擬現(xiàn)實場景,如工廠和城市,加速機器人導(dǎo)航和操作能力的開發(fā)。

目前,Genie2主要定位為研究與原型工具,尚未向公眾開放。但開發(fā)者可以通過DeepMind或Hugging Face的測試通道申請訪問權(quán)限。在申請成功后,開發(fā)者需要準(zhǔn)備輸入數(shù)據(jù),如高分辨率照片,以優(yōu)化生成質(zhì)量,并配置高性能的運行環(huán)境,如A100GPU或高性能集群,以支持實時生成。同時,開發(fā)者還可以使用鍵盤和鼠標(biāo)測試交互功能,或集成DeepMind的SIMA代理執(zhí)行任務(wù)。

自Genie2亮相《60分鐘》以來,社區(qū)對其3D交互生成與機器人訓(xùn)練潛力給予了高度評價。許多開發(fā)者認為,Genie2將靜態(tài)圖像轉(zhuǎn)化為動態(tài)世界的過程令人嘆為觀止,具有在游戲和VR領(lǐng)域的顛覆性潛力。然而,也有部分用戶指出,Genie2的生成時長和圖像質(zhì)量衰減問題限制了其商業(yè)化應(yīng)用,并期待DeepMind能夠延長一致性時間和優(yōu)化渲染效率。

DeepMind對此表示,將持續(xù)優(yōu)化Genie2的一致性和渲染效率,并考慮未來與Gemini Robotics整合,以增強機器人交互。同時,社區(qū)也在探討將Genie2與其他AI技術(shù)整合,構(gòu)建從環(huán)境生成到任務(wù)自動化的閉環(huán)生態(tài)。隨著技術(shù)的不斷進步,Genie2有望在未來成為3D世界平臺,提供共享環(huán)境模板和API,推動AI技術(shù)的進一步發(fā)展。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 鄂温| 土默特右旗| 美姑县| 天峻县| 常宁市| 平邑县| 壶关县| 安新县| 青铜峡市| 黑水县| 察雅县| 涟源市| 雷州市| 兴安县| 蓝田县| 彭阳县| 荆门市| 马尔康县| 无锡市| 五寨县| 成都市| 鹿邑县| 平果县| 滦平县| 抚宁县| 蒙城县| 黎平县| 彭阳县| 禹城市| 忻城县| 河东区| 义马市| 双桥区| 鲁山县| 大竹县| 罗甸县| 临湘市| 高尔夫| 武胜县| 同江市| 阳西县|