日本精品一区二区三区高清久久

ITBear旗下自媒體矩陣：

滾動資訊

當(dāng)前位置：首頁 > 資訊 > 業(yè)界動態(tài) > 正文內(nèi)容

百度蒸汽機(jī)再升級：流式生成技術(shù)突破時(shí)長限制，AI長視頻創(chuàng)作開啟新紀(jì)元

時(shí)間：2025-09-26 03:46:55 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

“多人對話音視頻一體化生成”大模型百度蒸汽機(jī)（MuseSteamer）迎來重大技術(shù)突破，其最新版本正式推出通用AI長視頻生成功能，用戶可借此生成任意時(shí)長的AI視頻內(nèi)容，徹底打破傳統(tǒng)AI視頻生成5秒、10秒的時(shí)長限制。

此次升級的核心亮點(diǎn)在于兩大技術(shù)突破：其一，通過流式生成技術(shù)實(shí)現(xiàn)視頻“無限”時(shí)長生成，用戶輸入一張參考圖和文本描述即可生成電影級質(zhì)感的長視頻；其二，首創(chuàng)生成過程中的交互式創(chuàng)作模式，用戶可隨時(shí)暫停生成并提交新的提示詞（prompt），動態(tài)調(diào)整后續(xù)劇情走向。

在技術(shù)實(shí)現(xiàn)層面，百度蒸汽機(jī)采用自回歸擴(kuò)散模型，結(jié)合幀級噪聲獨(dú)立控制與動態(tài)時(shí)間步調(diào)度策略，突破傳統(tǒng)擴(kuò)散模型在長視頻生成中的性能瓶頸。同時(shí)，依托商業(yè)體系強(qiáng)大的工程優(yōu)化能力，通過模型參數(shù)壓縮、窗口注意力機(jī)制優(yōu)化等手段，將推理耗時(shí)降至近乎實(shí)時(shí)水平，確保長視頻生成的流暢性與效率。

據(jù)項(xiàng)目負(fù)責(zé)人介紹，升級后的模型已實(shí)現(xiàn)理論上的無限時(shí)長視頻生成能力，用戶僅需輸入基礎(chǔ)素材即可生成包含多人對話、精準(zhǔn)口型同步的復(fù)雜視頻內(nèi)容。例如，在官方演示中，模型成功生成30秒及超1分鐘的連貫視頻片段，畫面質(zhì)量與敘事邏輯均達(dá)到專業(yè)水準(zhǔn)。

9月25日，百度商業(yè)體系商業(yè)研發(fā)總經(jīng)理劉林與知名編劇田博通過直播連麥，首次對外解析技術(shù)細(xì)節(jié)。劉林強(qiáng)調(diào)，此次升級不僅解決了AI視頻生成依賴首尾幀控制續(xù)寫的局限，更通過“生成中可交互”功能賦予用戶創(chuàng)作主導(dǎo)權(quán)。田博則指出，AI視頻生成技術(shù)僅用一年時(shí)間便完成電影行業(yè)50年的技術(shù)演進(jìn)，為編劇與內(nèi)容創(chuàng)作者開辟了前所未有的想象空間。

從應(yīng)用場景看，AI長視頻生成技術(shù)顯著降低了視頻創(chuàng)作門檻，助力個(gè)人創(chuàng)作者產(chǎn)出更完整、優(yōu)質(zhì)的內(nèi)容，同時(shí)為企業(yè)用戶、影視及廣告行業(yè)提供高效低成本的解決方案。目前，該技術(shù)已廣泛應(yīng)用于百度客戶的營銷創(chuàng)意中，知名視效指導(dǎo)姚騏曾使用蒸汽機(jī)2.0制作科幻短片《歸途》，將制作成本壓縮至數(shù)百元，驗(yàn)證了其商業(yè)化潛力。

作為全球首個(gè)中文音視頻一體化生成模型，百度蒸汽機(jī)自今年3月首發(fā)以來持續(xù)迭代：5月登頂VBench-I2V圖生視頻榜首；7月推出Turbo版模型及C端創(chuàng)作平臺“繪想”，實(shí)現(xiàn)畫面、音效與人聲臺詞的協(xié)同創(chuàng)作；8月完成音視頻一體化升級，支持多人有聲視頻生成；如今再次突破時(shí)長限制，成為行業(yè)首個(gè)具備“無限”生成能力的通用AI視頻模型。

數(shù)據(jù)顯示，蒸汽機(jī)Turbo版上線兩周注冊用戶量突破20萬，單小時(shí)任務(wù)提交量達(dá)1.8萬次，累計(jì)生成內(nèi)容超200萬條。據(jù)透露，該模型將于10月中旬進(jìn)一步升級，新增實(shí)時(shí)交互長視頻生成功能，涵蓋可交互數(shù)字人、VR/AR視頻內(nèi)容及動態(tài)游戲世界生成能力，持續(xù)推動AI視頻技術(shù)邊界拓展。

09-26

雷軍2025年度演講：自研芯片“把家底押上”，小米17系列發(fā)布與戰(zhàn)略復(fù)盤

09-26

長安第四代CS55PLUS正式登場 7.89萬起售外觀內(nèi)飾智能動力全維進(jìn)階

09-26

華為MatePad Mini悅讀版9月25日線下開售！柔性O(shè)LED屏+獨(dú)立通信，學(xué)習(xí)場景新選擇

僅平板，華為就推出了5大系列，覆蓋到學(xué)習(xí)、輕辦公、娛樂等場景使用，再加上PC級應(yīng)用、生態(tài)功能、衛(wèi)星通信等方面，讓華為平板優(yōu)勢更突出。新版本的影像配置與標(biāo)準(zhǔn)版本相同，所以前置擁有3200萬像素，光圈達(dá)到F/2…

09-26

?三星自研AI性能基準(zhǔn)測試工具TRUEBench上線，填補(bǔ)多語言多任務(wù)評估空白?

今日早些時(shí)候，三星宣布已開發(fā)出名為“可信真實(shí)場景使用評估基準(zhǔn)”（Trustworthy Real-world Usage EvaluationBenchmark，簡稱 TRUEBench）的自研 AI 基…

09-26

小米子品牌POCO官宣新旗艦：驍龍8EG5加持，POCO F8系列配置亮點(diǎn)搶先看

【CNMO科技消息】9月25日，CNMO注意到，小米手機(jī)旗下的第二子品牌POCO（主攻海外市場）官方宣布，其下一代旗艦級智能手機(jī)將搭載高通最新發(fā)布的驍龍8Elite Gen 5移動平臺。盡管POCO尚未公布…

09-26

vivo X300系列10月13日發(fā)布：天璣9500芯片領(lǐng)銜，影像續(xù)航雙突破

從新機(jī)所預(yù)熱的內(nèi)容，多方面進(jìn)行大升級，擁有更強(qiáng)大的性能，更專業(yè)的影像拍攝，提升新機(jī)優(yōu)勢。 vivo X300系列成功拿下聯(lián)發(fā)科的天璣9500旗艦芯片的全球首發(fā)，工藝制程保持3nm，CPU采用4個(gè)超大核、4個(gè)大…

09-26

驍龍8EliteGen5發(fā)布引熱議多款新機(jī)蓄勢待發(fā) 小米17今晚登場車企跨界聯(lián)動預(yù)熱

小米17系列、iQOO 15、真我GT8 Pro、一加15、榮耀Magic8系列、努比亞Z80 Ultra、紅魔11 Pro系列等紛紛更新了預(yù)熱海報(bào)，其中小米是“全球首發(fā)，今晚就發(fā)”，盧偉冰還稱“真首發(fā)，當(dāng)…

09-26

盧偉冰現(xiàn)場開箱小米17系列復(fù)古掌機(jī)殼讓手機(jī)秒變游戲神器

快科技9月25日消息，今晚小米17系列正式發(fā)布，發(fā)布會結(jié)束后，小米總裁盧偉冰現(xiàn)場開箱了小米新機(jī)。小米17、小米17 Pro、小米17 ProMax三款機(jī)型各4種顏色一同亮相。現(xiàn)場還演示了小米17 Pro秒…

09-26

一加將首發(fā)雙款驍龍8系新芯，一加15攜165超高幀與Ace6共拓市場

今天，高通還公布了另一顆 8 系旗艦芯片 —— 「第五代驍龍 8」的消息。我特別看好這顆芯片，它和「第五代驍龍 8至尊版」一樣，都是采用第三代 3nm 旗艦工藝設(shè)計(jì)，都是采用定制化的全新 Oryon C…

09-26

2025上半年VR市場遇冷出貨降14%，AR智能眼鏡增長50%顯復(fù)蘇態(tài)勢

按細(xì)分市場來看，基于 Birdbath 方案、以視頻為中心的 AR 智能眼鏡仍然占據(jù)主導(dǎo)地位，占出貨量的78%，其次是基于光波導(dǎo)（waveguide）、以信息顯示為主的 AR 智能眼鏡，占比約 17%。 …

09-26

高通「第五代驍龍 8」處理器重磅回歸，一加手機(jī)獲全球首發(fā)搭載權(quán)

IT之家 9 月 25 日消息，在今天的高通驍龍峰會 2025 上，除了第五代驍龍 8 至尊版處理器外，高通還公布了驍龍正代 8 系芯片——「第五代驍龍 8」時(shí)隔一年的回歸的消息。該處理器已官宣將由一加、v…

09-26

一加全球首發(fā)第五代驍龍8：工藝架構(gòu)全面對標(biāo)至尊版，性能手機(jī)市場或迎新體驗(yàn)

快科技9月25日消息，一加中國區(qū)總裁李杰宣布，一加首發(fā)第五代驍龍8。李杰表示，這是驍龍正代8系芯片時(shí)隔一年的回歸，它將由一加手機(jī)全球首發(fā)，我特別看好這顆芯片，它和第五代驍龍8至尊版一樣，都是采用第三代3nm…

09-26

小米17系列首發(fā)！第五代驍龍8至尊版：3nm工藝+自研核心性能AI雙突破

快科技9月25日消息，高通在今天正式推出第五代驍龍8至尊版，這是全球最快的移動Soc，由小米17系列全球首發(fā)搭載。據(jù)悉，第五代驍龍8至尊版采用了業(yè)界最先進(jìn)的臺積電第三代3nm工藝，并配備高通自研的第三代Or…

09-26

?OpenAI內(nèi)部測試GPT-Alpha智能體：基于GPT-5，支持多模態(tài)多任務(wù)處理?

此次曝光可能源于OpenAI的一次誤推更新，使部分用戶提前接觸到尚未發(fā)布的功能入口。此前，OpenAI發(fā)布過GPT-5-Codex模型，該模型通過Codex CLI命令行界面進(jìn)行操作，支持讀取、修改、執(zhí)行本…

09-26

點(diǎn)擊查看更多 +

全站最新

啟境汽車新篇開啟：25年行業(yè)老將劉嘉銘出任CEO，引領(lǐng)品牌破局

雷軍揭秘SU7 Ultra：2021年立項(xiàng)，春節(jié)后擱置，5月因工程師提議再重啟

雷軍年度演講談玄戒O1項(xiàng)目：小米造芯決心堅(jiān)定，至少十年投入500億

小米17系列正式登場：6.3英寸輕薄機(jī)身+7000mAh電池，起售4499元

京東9月25日發(fā)布三款A(yù)I新品：涵蓋購物、生活及具身智能領(lǐng)域

雷軍談小米十周年：行業(yè)巨頭如山，5年反思后發(fā)力硬核科技破局

熱門內(nèi)容

本欄最新

雷軍談小米十周年：行業(yè)巨頭如山，5年反思后發(fā)力硬核科技破局

?雷軍年度演講吐露心聲：曾因偏見內(nèi)耗，今展高管新貌9位“新將”加盟?

解析仰望U9X賽道版：三項(xiàng)世界第一加身，中國超跑開啟全球榮耀征程

小米17 Pro系列手機(jī)正式登場：妙享背屏+徠卡影像，全能旗艦4999元起售

?雷軍談小米：雖遭質(zhì)疑仍堅(jiān)定造芯造車，SU7與YU7背后有怎樣故事？?

?雷軍熱搜發(fā)聲：小米十五載高速發(fā)展下，人才短缺成關(guān)鍵挑戰(zhàn)?

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清久久

日本精品一区二区三区高清 久久

百度蒸汽機(jī)再升級：流式生成技術(shù)突破時(shí)長限制，AI長視頻創(chuàng)作開啟新紀(jì)元

日本精品一区二区三区高清久久