百度近期在AI領域的動作引人注目,尤其是在視頻生成技術上的布局,顯現出其戰略方向的顯著變化。
在7月2日舉辦的百度AI Day開放日上,百度正式推出了自研的視頻生成模型MuseSteamer及其配套的創作平臺“繪想”。這一舉措與去年李彥宏對于視頻生成技術的謹慎態度形成了鮮明對比。去年10月,據內部消息透露,李彥宏曾表示,類似于Sora的視頻生成模型,由于投入周期長、業務收益難以預見,百度不會涉足。
然而,隨著AI技術的飛速發展,特別是在AI搜索場景中,用戶對富媒體內容的需求日益增長,迫使百度重新評估其技術戰略。李彥宏口中曾提到的“業務收益”前景,或許正隱藏在這一變化之中。
MuseSteamer作為全球首個實現中文音視頻一體化生成的視頻模型,其技術突破令人矚目。該模型能夠協同創作畫面、音效及人聲臺詞,顛覆了傳統AIGC視頻中“先畫面后配音”的制作流程。在權威榜單VBench I2V上,MuseSteamer以89.38%的總分位居榜首。它還能從一張圖片中生成10秒長的1080p電影級畫質視頻,人物微表情與運鏡效果均達到專業影視水準。
MuseSteamer的技術優勢得益于億級中文多模態數據的清洗、精細化視頻結構化描述語言,以及多目標強化學習等技術的優化。為了滿足不同用戶的需求,MuseSteamer模型家族推出了Turbo、Lite、Pro及全系列有聲版,覆蓋從普通創作者到專業影視機構的廣泛群體。目前,Turbo版已在繪想平臺上開啟限時免費公測,其余版本也計劃在8月陸續上線。
為了進一步推動AI視頻創作的發展,繪想平臺還同步啟動了“跨次元捏合”AI視頻創作大賽。用戶只需通過單圖輸入,即可生成動態視頻作品參與比賽,這無疑將激發更多創作者的熱情和創造力。