百度商業(yè)研發(fā)團隊近期宣布了一項重要創(chuàng)新,于7月2日正式推出了名為“MuseSteamer”的自研視頻生成模型及其配套的創(chuàng)作平臺“繪想”。這一突破性技術(shù)被標榜為全球首個能夠?qū)崿F(xiàn)中文音視頻一體化生成的視頻模型,標志著視頻創(chuàng)作流程的一次重大革新。
傳統(tǒng)AIGC視頻制作往往遵循“先畫面后配音”的模式,而MuseSteamer則打破了這一常規(guī),實現(xiàn)了畫面、音效與人聲臺詞的協(xié)同創(chuàng)作。這一技術(shù)的問世,無疑為視頻創(chuàng)作者提供了更為便捷和高效的創(chuàng)作工具。
據(jù)百度商業(yè)研發(fā)團隊介紹,MuseSteamer在技術(shù)上實現(xiàn)了多項突破。它能夠根據(jù)一張圖片,快速生成長達10秒、分辨率為1080p的電影級畫質(zhì)視頻。視頻中的人物微表情和運鏡效果均達到了專業(yè)影視水準,這一能力得益于億級中文多模態(tài)數(shù)據(jù)的清洗、精細化視頻結(jié)構(gòu)化描述語言,以及多目標強化學(xué)習(xí)等技術(shù)的優(yōu)化。
為了滿足不同創(chuàng)作者的需求,MuseSteamer模型家族推出了多個版本,包括Turbo、Lite、Pro及全系列有聲版。這些版本覆蓋了從普通創(chuàng)作者到專業(yè)影視機構(gòu)的廣泛需求,為各類用戶提供了定制化的解決方案。目前,Turbo版已在繪想平臺上開啟限時免費公測,而其余版本則計劃在8月陸續(xù)開放。
MuseSteamer的推出,不僅為視頻創(chuàng)作者提供了更為強大的技術(shù)支持,也預(yù)示著視頻創(chuàng)作行業(yè)將迎來一次新的變革。隨著技術(shù)的不斷進步和應(yīng)用場景的不斷拓展,MuseSteamer有望成為未來視頻創(chuàng)作領(lǐng)域的重要推手。