全球視頻生成領域迎來新一輪技術競爭,OpenAI與國內科技企業接連推出創新產品,推動行業進入實時交互與長視頻生成的新階段。10月1日,OpenAI發布Sora 2視頻生成應用,引發行業關注;半個月后,百度宣布其視頻生成模型“蒸汽機”完成重大升級,首次實現AI長視頻實時交互生成功能,成為國內首個突破傳統10秒時長限制的模型。
據百度副總裁陳一凡介紹,升級后的蒸汽機模型依托流式視頻技術,不僅支持無限時長生成(產品層面根據用戶場景設置限制),還實現了生成速度超越國內主流模型。該模型提供圖生視頻、視頻生視頻雙模式:在圖生視頻中,用戶可實時查看推理過程,隨時暫停或修改提示詞以控制劇情、畫面和轉場;在視頻生視頻中,用戶可對素材進行續寫或任意幀改寫,并實時預覽結果。
定價方面,蒸汽機延續首發策略,Turbo有聲版價格為2.5元/秒(首發雙周優惠1.4元/5秒),C端用戶可通過“繪想”平臺會員充值,最低41元/月起。對比國際市場,Sora 2 API定價為0.1美元/秒起,C端用戶需訂閱ChatGPT Plus(20美元/月)或Pro(200美元/月)會員。
除長視頻生成外,蒸汽機還推出兩大創新功能:可交互數字人與開放世界動態構建。數字人支持沉浸式雙向互動,可應用于AI導購、教育、陪伴等場景;開放世界則允許用戶在AI生成的游戲地圖、旅游景點或宇宙空間中自由探索。百度工作人員表示,這些功能將推動內容消費從“被動接收”轉向“共同創造”,甚至催生新型藝術形式與商業生態。
國際市場上,谷歌在百度蒸汽機升級當晚推出Veo 3.1版,重點提升音頻輸出、精細化編輯控制及圖像轉視頻效果,并新增視頻擴展、首尾幀補過渡、圖片引導風格控制三大功能。陳一凡指出,當前視頻生成賽道技術競爭激烈,短期優勢易被超越,企業需通過執行力和生態構建能力保持領先。
產品化與生態建設的重要性日益凸顯。例如,Sora 2推出獨立iOS App,支持用戶瀏覽、分享優質生成作品,甚至與其他用戶共創,引發其入局社交內容的討論。對此,百度商業研發總經理劉林表示,蒸汽機暫無獨立App計劃,但未來可能作為發展方向,目前新技術均接入百度App。
同期,百度搜索宣布全面升級文心助手AIGC創作能力,支持AI圖片、視頻、音樂、播客等8種模態創作,并打通全模態生成。用戶可通過百度首頁進入文心助手,每日產生千萬量級AIGC內容。以視頻生成場景為例,用戶輸入描述后,AI可自動完成3分鐘故事片的情節設計、角色塑造、場景搭建、鏡頭運鏡及聲音配樂全流程。文心助手還集成“一句話寫歌”“MV制作”等30余種特效玩法,后續將上線音樂數字人分身功能。
在數字人領域,百度搜索發布行業首個開放式實時互動智能體,支持用戶與持證真人專家的數字分身進行1v1對話,提供法律、情感、旅游等場景的專業陪伴與咨詢服務。該功能基于百度數字人技術、多模態模型及多智能體協作實現。







