百度旗下視頻生成模型迎來重大技術突破,其自主研發的“蒸汽機(文心專精)”系統首次實現AI長視頻實時交互生成功能。通過流式視頻技術的創新應用,該系統成功打破傳統AI視頻生成10秒左右的時長桎梏,支持“無限時長”內容輸出,生成效率顯著領先國內同類產品。
用戶操作流程得到深度優化,僅需上傳單張圖片并輸入文字提示即可啟動創作。系統獨創的實時預覽功能可完整展示模型推理過程,生成過程中用戶可隨時中斷操作,或在任意時間節點修改提示詞,對視頻劇情走向、畫面細節及轉場效果進行動態調整。這種交互模式將傳統AI視頻的“單向輸出”轉變為“雙向共創”,為用戶提供“無限畫布”般的連續創作體驗。
此次技術升級同步推出兩大創新功能:可交互數字人與開放世界動態構建系統。數字人支持多模態沉浸式互動,已應用于智能導購、在線教育、情感陪伴等多個場景;開放世界系統則賦予用戶完全操控權,可在AI生成的虛擬游戲地圖、數字旅游景區及宇宙探索場景中進行自由探索與交互。
自今年5月啟動持續迭代計劃以來,該模型已陸續實現音視頻同步生成、多角色對話生成、移動端適配等關鍵技術突破。本次長視頻實時交互功能的落地,不僅拓展了影視預演、互動娛樂、個性化營銷等領域的應用場景,更推動AIGC技術從基礎素材生成向深度內容共創平臺轉型。


















