百度近期在AI領域的動作引發了廣泛關注。在7月2日舉辦的百度AI Day開放日上,百度宣布了一項重要更新:其搜索功能將接入由商業研發團隊自主開發的視頻生成模型MuseSteamer,以及配套的創作平臺“繪想”。這一舉動標志著百度在視頻生成技術上的立場發生了顯著變化。
回溯至去年10月,百度創始人李彥宏曾明確表示,百度不會涉足類似Sora的視頻生成模型。據當時的內部講話透露,李彥宏認為這類模型的投入周期長,可能在10年甚至20年內都無法獲得業務收益,因此百度選擇不參與。然而,隨著AI2.0時代的加速到來,特別是在AI搜索場景中,用戶對富媒體輸出的需求日益增長,百度不得不重新審視其策略。
MuseSteamer模型的推出,正是百度應對這一變化的舉措之一。作為全球首個實現中文音視頻一體化生成的視頻模型,MuseSteamer打破了傳統AIGC視頻制作中“先畫面后配音”的固定流程,實現了畫面、音效與人聲臺詞的協同創作。這一技術突破,不僅提升了視頻制作的效率,更在質量上達到了新的高度。
MuseSteamer在權威榜單VBench I2V中以89.38%的總分奪得全球第一,其強大的性能得到了充分證明。該模型支持從一張圖片生成10秒長的1080p電影級畫質視頻,人物微表情與運鏡效果均達到專業影視水準。這些成就的背后,是億級中文多模態數據的清洗、精細化視頻結構化描述語言的應用,以及多目標強化學習等技術的不斷優化。
為了滿足不同用戶的需求,MuseSteamer模型家族推出了多個版本,包括Turbo、Lite、Pro及全系列有聲版,覆蓋了從普通創作者到專業影視機構的廣泛需求。目前,Turbo版已在繪想平臺上開啟限時免費公測,其他版本也將于8月陸續上線。為了進一步推動AI視頻創作的發展,繪想平臺還同步啟動了“跨次元捏合”AI視頻創作大賽,鼓勵用戶通過單圖輸入生成動態視頻作品參與競賽。
百度的這一系列動作,不僅展示了其在AI技術上的持續創新,也反映了其對市場需求的敏銳洞察。隨著AI技術的不斷進步和應用場景的不斷拓展,百度正通過不斷調整和優化其策略,以適應行業發展的新趨勢。