在百度AI DAY科技開放日的盛會上,百度移動生態商業研發團隊隆重推出了其自研的視頻生成模型MuseSteamer,以及配套的視頻產品平臺“繪想”。MuseSteamer采用了DIT架構,其參數規模與業界頂尖的視頻生成模型相當,能夠生成連續10秒的動態視頻,并支持最高1080P的高清分辨率。
這一創新之舉令人意外,因為就在去年10月,百度CEO李彥宏還曾在內部講話中表示,由于視頻生成模型如Sora的投入周期長,百度并不打算涉足這一領域。然而,僅數月之后,百度便以實際行動打破了這一說法。
在隨后的媒體溝通會上,百度副總裁、移動生態商業體系負責人陳一凡解釋了百度轉變決策的背后原因。他指出,為了滿足代理商和廣告主對于快速生成廣告的需求,百度去年推出了擎舵平臺。但在實際應用中,代理商和廣告主反饋稱,一些科幻場景難以通過實拍實現,希望能借助大模型生成。基于這一反饋,百度移動生態商業體系決定自研視頻生成模型。
據一位百度內部人士透露,李彥宏在去年的內部講話中確實提到,基于多模態需求,可以探索一些相對特定的視頻生成場景。此次發布的視頻生成模型MuseSteamer,以及此前發布的羅永浩數字人,都是百度在這一方向上持續探索的成果。
與市場上大多數技術驅動型的視頻生成模型不同,百度的視頻生成模型MuseSteamer采用的是商業驅動模式。即先明確商業需求,再結合需求進行模型研發。這一模式使得MuseSteamer在應用場景上更加明確和具體。
據百度商業體系商業研發總經理劉林介紹,MuseSteamer項目在今年春節后才正式立項,研發團隊僅有幾十人,但有效的研發時間卻僅有3個月。之所以能夠如此迅速地推出產品,得益于擎舵平臺在多模態生成技術上的積累,以及百度商業體系在模型訓練框架推理、卡片調優等方面的技術儲備。
此次百度推出的MuseSteamer和“繪想”平臺,不僅展示了百度在AI技術上的深厚積累,也體現了其對于市場需求變化的敏銳洞察和快速響應能力。這一創新之舉無疑將為廣告行業帶來新的變革和機遇。