阿里近日正式推出新一代萬相2.6系列視頻生成模型,該模型在專業影視制作與圖像創作領域實現全面突破,成為國內首個具備角色扮演功能的視頻生成工具。其核心功能涵蓋音畫同步、多鏡頭智能生成及聲音驅動技術,憑借完整的功能矩陣躋身全球領先行列,目前已通過阿里云百煉平臺與萬相官網同步開放使用。
相較于9月發布的萬相2.5版本,新模型在畫質精度、音效還原及指令響應能力上顯著提升,單次生成視頻時長突破至15秒,創下國內同類產品紀錄。創新性的角色扮演功能支持用戶通過上傳參考視頻,提取人物外觀、音色特征及動作姿態,結合文本提示詞自動生成單人、多人或人與物互動的影視級片段。例如用戶上傳日常視頻并輸入科幻題材提示詞,系統可自動完成分鏡設計、角色演繹與配音,數分鐘內產出具備電影級運鏡的完整短片。
技術架構層面,萬相2.6采用多模態聯合建模機制,對輸入視頻進行時空維度深度解析。通過捕捉主體情緒變化、姿態軌跡及多角度視覺特征,同步提取語速、音調等聲學參數,確保生成內容在畫面構圖、聲音表現及敘事節奏上保持高度一致。該模型已實現單人與多人表演場景的無縫切換,在廣告設計、短劇制作等商業場景中展現出強大適應性。
針對專業創作需求,模型新增的分鏡控制功能可自動將簡單提示詞轉化為多鏡頭腳本,生成包含完整故事線的敘事視頻。通過高層語義理解技術,系統能構建具備敘事張力的鏡頭段落,在鏡頭切換過程中維持主體位置、場景布局及環境氛圍的統一性。測試顯示,在連續提示詞輸入下,模型可生成廣告創意視頻,確保商品主體與背景元素在多鏡頭中保持視覺連貫。
該模型的普及應用正重塑視覺創作生態。個人用戶通過萬相官網即可體驗基礎功能,企業客戶可通過阿里云百煉API接入專業版服務,千問APP也將于近期上線互動玩法。目前萬相模型家族已拓展至10余種創作能力,覆蓋文生圖、圖像編輯、動作生成等全鏈條,在AI漫劇開發、短視頻制作等領域形成規模化應用,日均處理創作請求量突破百萬次。
技術團隊透露,后續迭代將聚焦于提升長視頻生成穩定性與交互式創作體驗。通過優化時空建模算法與擴展多語言支持,模型有望在跨國影視制作、虛擬偶像運營等新興領域開辟更多應用場景。此次升級標志著國內AI視頻生成技術正式進入專業化、場景化發展新階段。









