滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 人工智能 > 正文內(nèi)容

智源研究院推出Emu3.5多模態(tài)大模型，為AI邁向物理世界提供新路徑

時(shí)間：2025-10-31 04:18:07 來(lái)源：快訊編輯：快訊 IP：北京 發(fā)表評(píng)論無(wú)障礙通道

在人工智能技術(shù)飛速發(fā)展的當(dāng)下，智源研究院再次成為行業(yè)焦點(diǎn)。近日，智源研究院在北京成功舉辦“悟界 ? Emu系列技術(shù)交流會(huì)”，會(huì)上，智源研究院院長(zhǎng)王仲遠(yuǎn)與多模態(tài)大模型負(fù)責(zé)人王鑫龍共同宣布，推出具有劃時(shí)代意義的Emu3.5多模態(tài)世界大模型，這一成果標(biāo)志著人工智能從單一語(yǔ)言學(xué)習(xí)向多模態(tài)世界學(xué)習(xí)邁出了關(guān)鍵一步。

回溯至2024年10月，智源研究院便已發(fā)布全球首個(gè)原生多模態(tài)世界模型Emu3。該模型獨(dú)辟蹊徑，僅基于下一個(gè)token預(yù)測(cè)技術(shù)，無(wú)需依賴擴(kuò)散模型或組合方法，便實(shí)現(xiàn)了圖像、文本、視頻的深度融合與統(tǒng)一處理。一經(jīng)問(wèn)世，便在技術(shù)社區(qū)引發(fā)了廣泛關(guān)注和熱烈討論。

時(shí)隔一年，智源研究院再度發(fā)力，推出Emu3.5。此次升級(jí)，在“Next-Token Prediction”范式的基礎(chǔ)上，創(chuàng)新性地模擬人類自然學(xué)習(xí)方式，通過(guò)自回歸架構(gòu)實(shí)現(xiàn)了對(duì)多模態(tài)序列的“Next-State Prediction (NSP)”，從而賦予模型更強(qiáng)大的可泛化世界建模能力。王仲遠(yuǎn)院長(zhǎng)表示：“Emu3驗(yàn)證了自回歸架構(gòu)在多模態(tài)理解與生成中的可行性，而Emu3.5則開(kāi)啟了多模態(tài)Scaling的新篇章，為構(gòu)建更通用、能與物理世界交互的人工智能提供了堅(jiān)實(shí)路徑。”

Emu3.5的訓(xùn)練過(guò)程堪稱浩大，它基于超過(guò)10萬(wàn)億token的大規(guī)模多模態(tài)數(shù)據(jù)，視頻數(shù)據(jù)訓(xùn)練量時(shí)長(zhǎng)實(shí)現(xiàn)了從15年到790年的驚人躍升，參數(shù)量也從8B提升至34B，充分展現(xiàn)了原生多模態(tài)Scaling范式的巨大潛力。在推理環(huán)節(jié)，Emu3.5更是創(chuàng)新性地提出了“離散擴(kuò)散自適應(yīng)”（Discrete Diffusion Adaptation，DiDA）技術(shù)，這一高效的混合推理預(yù)測(cè)方法，在不犧牲性能的前提下，將每張圖片的推理速度提升了近20倍，首次使自回歸模型的生成效率達(dá)到了頂尖閉源擴(kuò)散模型的水平。

王鑫龍進(jìn)一步介紹：“EMU3.5在原生多模態(tài)的大規(guī)模預(yù)訓(xùn)練、大規(guī)模強(qiáng)化學(xué)習(xí)和高效推理方面均取得了突破，為多模態(tài)世界模型的發(fā)展指明了一條簡(jiǎn)單易擴(kuò)展的Scaling范式。”

值得一提的是，EMU3.5模型開(kāi)始展現(xiàn)出學(xué)習(xí)現(xiàn)實(shí)世界物理動(dòng)態(tài)與因果關(guān)系的強(qiáng)大能力，為探索通用世界模型奠定了堅(jiān)實(shí)基礎(chǔ)。該模型具備三大顯著特點(diǎn)：一是從意圖到規(guī)劃，能夠理解高層級(jí)的人類意圖，如“如何制作一艘宇宙飛船”或“如何做咖啡拉花”，并自主生成詳細(xì)、連貫的多步驟行動(dòng)路徑；二是動(dòng)態(tài)世界模擬，能夠在統(tǒng)一框架內(nèi)無(wú)縫融合對(duì)世界的理解、規(guī)劃與模擬，預(yù)測(cè)物理動(dòng)態(tài)、時(shí)空演化和長(zhǎng)時(shí)程因果關(guān)系；三是可成為泛化交互基礎(chǔ)，其涌現(xiàn)出的因果推理和規(guī)劃能力，為AI與人類及物理環(huán)境進(jìn)行泛化交互提供了關(guān)鍵的認(rèn)知基礎(chǔ)。

在實(shí)際應(yīng)用中，Emu3.5在多模態(tài)指導(dǎo)方面展現(xiàn)出卓越的時(shí)序一致性與步驟推理能力，使復(fù)雜任務(wù)的執(zhí)行過(guò)程更加清晰透明。同時(shí)，其多模態(tài)敘事能力也令人矚目，能夠圍繞任意主題生成沉浸式的故事體驗(yàn)，激發(fā)無(wú)限想象力。該模型還具備跨場(chǎng)景的具身操作能力，能夠?qū)崿F(xiàn)泛化的動(dòng)作規(guī)劃與復(fù)雜交互，并在世界探索中保持長(zhǎng)距離一致性與可控交互，兼顧真實(shí)與虛擬的動(dòng)態(tài)環(huán)境，實(shí)現(xiàn)自由探索與精準(zhǔn)控制。

在圖文編輯領(lǐng)域，Emu3.5同樣表現(xiàn)出色。它既能通過(guò)自然語(yǔ)言實(shí)現(xiàn)任意指令的圖片編輯與時(shí)空變換，也能以精準(zhǔn)、智能、可控且富有創(chuàng)意的方式完成文圖生成，使文字與視覺(jué)內(nèi)容的融合更加自然與高保真。在基準(zhǔn)測(cè)試中，Emu3.5的表現(xiàn)更是超越了眾多知名的閉源模型，彰顯了其強(qiáng)大的技術(shù)實(shí)力。

融入Keevx后的百度智能云智能營(yíng)銷(xiāo)產(chǎn)品矩陣，也得以首次系統(tǒng)化亮相，完整覆蓋“找對(duì)人 - 吸引ta - 轉(zhuǎn)化ta - 留住ta” 的營(yíng)銷(xiāo)全鏈路。作為全球AI云首倡者，百度智能云構(gòu)建起了從芯片、算力，到模型、…

10-31

FocusAgent：智能篩選助力網(wǎng)頁(yè)機(jī)器人，信息處理效率與安全性雙提升

10-31

南加大團(tuán)隊(duì)新探索：以“長(zhǎng)度感知”策略解鎖AI數(shù)學(xué)訓(xùn)練新效能

10-31

英屬哥倫比亞大學(xué)與快手團(tuán)隊(duì)新突破：AI繪畫(huà)“零標(biāo)注”精準(zhǔn)聽(tīng)懂文字指令

10-31

云天勵(lì)飛前三季度營(yíng)收大增97% 現(xiàn)金流穩(wěn)健加速構(gòu)建國(guó)產(chǎn)AI芯片生態(tài)平臺(tái)

10-31

人形機(jī)器人價(jià)格高昂難普及？智元牽頭組建租賃聯(lián)盟探索“按需即用”新路徑

10-31

從AI營(yíng)銷(xiāo)到AI版LinkedIn，指數(shù)引力如何借AI之力重塑商業(yè)關(guān)系網(wǎng)絡(luò)？

10-31

杭叉集團(tuán)CeMAT ASIA 2025展首發(fā)X1物流人形機(jī)器人，開(kāi)啟全場(chǎng)景智能物流新篇章

在10月28日至31日舉行的上海CeMAT ASIA 2025亞洲國(guó)際物流展上，杭叉集團(tuán)以“智慧物流杭叉領(lǐng)創(chuàng)”為主題，全球首次發(fā)布杭叉X1系列物流人形機(jī)器人，標(biāo)志著公司完成了從傳統(tǒng)工業(yè)車(chē)輛制造商向全場(chǎng)景智能…

10-31

貴州翰凱斯：貴陽(yáng)研發(fā)領(lǐng)航湖州量產(chǎn)助力無(wú)人駕駛產(chǎn)品行銷(xiāo)30國(guó)

10月28日，扎根于貴陽(yáng)高新區(qū)的貴州翰凱斯智能技術(shù)有限公司傳來(lái)喜訊——其位于浙江湖州的數(shù)字制造工廠正式投產(chǎn)。作為翰凱斯在國(guó)內(nèi)的首個(gè)量產(chǎn)基地，該工廠的落地標(biāo)志著企業(yè)完成了從“貴陽(yáng)研發(fā)”到“全球制造”的戰(zhàn)略關(guān)鍵跨…

10-31

MiniMax以M2破局：在AI深水區(qū)選對(duì)路徑，以定力向終局之戰(zhàn)進(jìn)發(fā)

2023年，ChatGPT席卷全球，掀起AI風(fēng)口，一時(shí)間，國(guó)內(nèi)涌現(xiàn)了一批大模型公司，大廠也在研究大模型，拉開(kāi)了“百模大戰(zhàn)”帷幕。就是這次發(fā)布會(huì)，讓公眾看到了平日低調(diào)的MiniMax與全球用戶日均30億次交互…

10-31

數(shù)智賦能：主流媒體“智媒+”生態(tài)中AI的價(jià)值探索與實(shí)踐

10月30日，在2025(第十屆)黨媒網(wǎng)站發(fā)展論壇上，6位嘉賓圍繞“數(shù)智驅(qū)動(dòng) 拓展‘智媒+’生態(tài)”主題，結(jié)合媒體實(shí)踐分享技術(shù)應(yīng)用成果、解析風(fēng)險(xiǎn)防范路徑，就主流媒體如何使用AI創(chuàng)造價(jià)值進(jìn)行分享。中國(guó)青年網(wǎng)副總編…

10-31

百度智能云雙11推免費(fèi)AI營(yíng)銷(xiāo)權(quán)益，全鏈路方案助力企業(yè)降本增效拓客群

10-31

AI可穿戴設(shè)備：從“小物件”到健康管理“主力軍”的蛻變之路

10-31

MiniMax：在AI深水區(qū)以定力與遠(yuǎn)見(jiàn)，探尋終局之戰(zhàn)的破局密鑰

10-31

靈心巧手全資在深設(shè)靈心伙伴科技公司，3000萬(wàn)注冊(cè)資本開(kāi)啟新征程

10-30

點(diǎn)擊查看更多 +

全站最新

小米高管徐潔云發(fā)聲：理想MEGA設(shè)計(jì)獨(dú)特，超大空間便捷補(bǔ)能是好車(chē)

?交付周期長(zhǎng)、價(jià)格波動(dòng)大、安全爭(zhēng)議多，小米汽車(chē)二手市場(chǎng)遇冷何解？?

?小米YU7等三款車(chē)五環(huán)續(xù)航測(cè)試遭疑，汽車(chē)之家詳述測(cè)試細(xì)節(jié)并表態(tài)將深化測(cè)試?

雷軍“定價(jià)調(diào)整”背后：存儲(chǔ)漲價(jià)潮下，國(guó)產(chǎn)存儲(chǔ)崛起窗口已至

小米YU7等三車(chē)?yán)m(xù)航測(cè)試結(jié)果遭疑，汽車(chē)之家從多維度回應(yīng)測(cè)試情況

汽車(chē)之家回應(yīng)冬測(cè)質(zhì)疑：京津冀低溫續(xù)航測(cè)試還原真實(shí)場(chǎng)景，小米YU7續(xù)航奪冠

熱門(mén)內(nèi)容

本欄最新

Grok家族再添新成員！新AI伴侶Mika正式亮相已有五位伙伴同行

頭部985高校AI大模型算法博士：學(xué)術(shù)之路閃耀，收入表現(xiàn)亮眼

小米與北大聯(lián)合論文現(xiàn)“天才少女”羅福莉之名，其職業(yè)軌跡與千萬(wàn)年薪傳聞引關(guān)注

2025百度世界大會(huì)11月13日啟幕，年度盛會(huì)共探技術(shù)新趨勢(shì)

截至10月11日，上海累計(jì)完成119款生成式AI服務(wù)登記，新增5款

截至2025年10月9日北京市新增3款生成式AI服務(wù) 累計(jì)備案達(dá)161款

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

智源研究院推出Emu3.5多模態(tài)大模型，為AI邁向物理世界提供新路徑

日本精品一区二区三区高清久久