滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 業(yè)界動(dòng)態(tài) > 正文內(nèi)容

阿里通義萬(wàn)相VACE開(kāi)源：視頻編輯迎來(lái)一站式創(chuàng)新模型

時(shí)間：2025-05-15 08:57:02 來(lái)源：ITBEAR編輯：快訊團(tuán)隊(duì) IP：北京 發(fā)表評(píng)論無(wú)障礙通道

近日，視頻編輯技術(shù)領(lǐng)域迎來(lái)了一次革命性的進(jìn)展，通義萬(wàn)相正式宣布將其創(chuàng)新的視頻編輯模型VACE進(jìn)行開(kāi)源。此次推出的VACE包含兩個(gè)版本，Wan2.1-VACE-1.3B支持480P分辨率的視頻處理，而更高規(guī)格的Wan2.1-VACE-14B則進(jìn)一步支持到720P分辨率，為用戶(hù)提供更多選擇。

VACE的問(wèn)世，徹底顛覆了傳統(tǒng)的視頻創(chuàng)作模式。用戶(hù)無(wú)需再在各種模型和工具之間來(lái)回切換，僅憑VACE即可實(shí)現(xiàn)從文字生成視頻、圖像參考生成、局部編輯到視頻擴(kuò)展等一系列操作，極大地提升了創(chuàng)作的便捷性和效率。這一站式視頻創(chuàng)作體驗(yàn)，讓視頻編輯變得更加靈活和高效。

VACE的核心競(jìng)爭(zhēng)力在于其強(qiáng)大的可控重繪能力。通過(guò)基于人體姿態(tài)、運(yùn)動(dòng)光流、結(jié)構(gòu)保持、空間運(yùn)動(dòng)和著色等多種控制生成技術(shù)，VACE能夠輕松實(shí)現(xiàn)視頻生成后的細(xì)致調(diào)整。它還支持基于主體和背景參考的視頻生成，使得調(diào)整人物姿態(tài)、動(dòng)作軌跡或場(chǎng)景布局等操作變得易如反掌。這一能力的背后，是VACE先進(jìn)的多模態(tài)輸入機(jī)制。

VACE的多模態(tài)輸入機(jī)制將文本、圖像、視頻、Mask和控制信號(hào)等多種輸入形式整合到一個(gè)統(tǒng)一的系統(tǒng)中。無(wú)論是圖像輸入中的物體參考圖或視頻幀，還是視頻輸入中的抹除、局部擴(kuò)展等操作，VACE都能應(yīng)對(duì)自如。用戶(hù)還可以通過(guò)0/1二值信號(hào)來(lái)指定編輯區(qū)域，并通過(guò)深度圖、光流、布局、灰度、線稿和姿態(tài)等控制信號(hào)來(lái)進(jìn)一步精確控制。

VACE不僅支持對(duì)視頻內(nèi)容的替換、增加和刪除等操作，還能在時(shí)間維度上根據(jù)任意片段或首尾幀補(bǔ)全整個(gè)視頻時(shí)長(zhǎng)。在空間維度上，VACE同樣表現(xiàn)出色，能夠?qū)Ξ?huà)面邊緣或背景區(qū)域進(jìn)行擴(kuò)展生成，如背景替換功能，可以在保留主體不變的前提下，根據(jù)Prompt更換背景環(huán)境。這些功能的實(shí)現(xiàn)，得益于VACE強(qiáng)大的多模態(tài)輸入模塊和Wan2.1的卓越生成能力。

更VACE還支持多種單任務(wù)能力的自由組合，打破了傳統(tǒng)專(zhuān)家模型各自為戰(zhàn)的限制。作為統(tǒng)一模型，VACE能夠自然融合文生視頻、姿態(tài)控制、背景替換、局部編輯等原子能力，無(wú)需為單一功能單獨(dú)訓(xùn)練新模型。這種靈活組合機(jī)制不僅簡(jiǎn)化了創(chuàng)作流程，還極大地拓展了AI視頻生成的創(chuàng)意邊界。

例如，通過(guò)組合圖片參考與主體重塑功能，VACE可以實(shí)現(xiàn)視頻中物體的替換；通過(guò)組合運(yùn)動(dòng)控制與首幀參考功能，則可以實(shí)現(xiàn)靜態(tài)圖片的姿態(tài)控制。還可以將圖片參考、首幀參考、背景擴(kuò)展與時(shí)長(zhǎng)延展功能相結(jié)合，將豎版圖拓展為橫屏視頻，并在其中加入?yún)⒖紙D片中的元素。這些功能的實(shí)現(xiàn)，都得益于VACE提出的靈活統(tǒng)一的輸入范式——視頻條件單元VCU。

VCU將多模態(tài)的各類(lèi)上下文輸入總結(jié)為文本、幀序列、mask序列三大形態(tài)，從而在輸入形式上統(tǒng)一了四類(lèi)視頻生成與編輯任務(wù)。VCU的幀序列和Mask序列在數(shù)學(xué)上可以相互疊加，為多任務(wù)的自由組合創(chuàng)造了有利條件。在技術(shù)實(shí)現(xiàn)方面，VACE需要解決的一大難題是如何將多模態(tài)輸入統(tǒng)一編碼為擴(kuò)散Transformer可處理的token序列。為此，VACE對(duì)VCU輸入中的frame序列進(jìn)行概念解耦，并通過(guò)隱空間編碼和可訓(xùn)練參數(shù)映射等步驟，成功將多模態(tài)輸入轉(zhuǎn)化為DiT的token序列。

在訓(xùn)練策略上，VACE對(duì)比了全局微調(diào)與上下文適配器微調(diào)兩種方案，并最終選擇了收斂速度更快且能避免基礎(chǔ)能力丟失風(fēng)險(xiǎn)的上下文適配器微調(diào)方法。通過(guò)定量評(píng)測(cè)可以看出，相比1.3Bpreview版本，本次開(kāi)源的VACE系列模型在多個(gè)關(guān)鍵指標(biāo)上均有顯著提升。

對(duì)于廣大開(kāi)發(fā)者而言，VACE的開(kāi)源無(wú)疑是一個(gè)巨大的福音。他們可以通過(guò)GitHub（https://github.com/Wan-Video/Wan2.1）、魔搭（https://modelscope.cn/organization/Wan-AI）、Hugging Face（https://huggingface.co/Wan-AI）等平臺(tái)獲取VACE的源代碼和模型資源，并在國(guó)內(nèi)站（https://tongyi.aliyun.com/wanxiang/）和國(guó)際站（https://wan.video）上獲取更多信息和支持。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

06-23

南方電網(wǎng)新能源服務(wù)全解析：2025修訂版指南，項(xiàng)目推進(jìn)必備手冊(cè)！

06-23

路博潤(rùn)Lubrizol MF9145V添加劑：高效解決柴油車(chē)DPF養(yǎng)護(hù)挑戰(zhàn)

06-23

博世i-Hybrid旗艦店滬上啟航，探索高端舒適家居新境界

06-23

LinkedIn CEO：AI帖子潤(rùn)色建議遇冷，但AI技能需求大增

06-23

Ftrans文件擺渡系統(tǒng)：重塑企業(yè)跨網(wǎng)傳輸安全高效新生態(tài)

文件擺渡系統(tǒng)，也稱(chēng)為跨網(wǎng)文件傳輸系統(tǒng)，是一種在物理或邏輯隔離的網(wǎng)絡(luò)環(huán)境間，實(shí)現(xiàn)安全合規(guī)數(shù)據(jù)交換的軟件工具，保障文件在隔離環(huán)境之間安全高效地傳遞。飛馳云聯(lián)文件擺渡系統(tǒng)的應(yīng)用，解決了企業(yè)傳統(tǒng)傳輸方式審核-傳輸環(huán)…

06-23

揚(yáng)州通華專(zhuān)用車(chē)喜獲江蘇省智能工廠稱(chēng)號(hào)，智能制造再添新榮耀！

06-23

張朝陽(yáng)直播談高考物理：難度不宜過(guò)高，呼吁回歸基礎(chǔ)考察

06-23

Meta攜手Oakley推出AI運(yùn)動(dòng)眼鏡，讓運(yùn)動(dòng)達(dá)人盡享“無(wú)拘無(wú)束”新體驗(yàn)

06-23

Moonshot AI首推自主強(qiáng)化學(xué)習(xí)Agent，Kimi-Researcher灰度測(cè)試進(jìn)行中

06-23

工業(yè)制造數(shù)字化新篇章：千兆光網(wǎng)業(yè)務(wù)體驗(yàn)分級(jí)白皮書(shū)深度解讀

在此背景下，“追光計(jì)劃-工業(yè)領(lǐng)航行動(dòng)”啟動(dòng)，《工業(yè)制造企業(yè)千兆光網(wǎng)業(yè)務(wù)體驗(yàn)分級(jí)白皮書(shū)》由中國(guó)信息通信研究院等多家單位共同編寫(xiě)，圍繞業(yè)務(wù)體驗(yàn)和網(wǎng)絡(luò)承載能力，提出面向工業(yè)制造企業(yè)的業(yè)務(wù)體驗(yàn)分級(jí)及對(duì)應(yīng)的千兆光網(wǎng)承載…

06-23

自動(dòng)套袋機(jī)：未來(lái)生產(chǎn)新趨勢(shì)，智能化環(huán)保挑戰(zhàn)并存

自動(dòng)套袋機(jī)在現(xiàn)代生產(chǎn)中扮演著越來(lái)越重要的角色，尤其是在包裝行業(yè)。此外，隨著智能技術(shù)的發(fā)展，未來(lái)的自動(dòng)套袋機(jī)將可能配備更多的自動(dòng)故障檢測(cè)和自我診斷功能，降低了對(duì)專(zhuān)業(yè)技能的依賴(lài)。在環(huán)保方面，隨著法規(guī)和消費(fèi)者對(duì)可…

06-23

山東科嘉電氣DC220V轉(zhuǎn)240V電源轉(zhuǎn)換器：高效穩(wěn)定，適用于多場(chǎng)景

山東科嘉電氣的DC220V轉(zhuǎn)DC240V DC-DC電源轉(zhuǎn)換器是一款針對(duì)直流電壓轉(zhuǎn)換需求設(shè)計(jì)的高性能設(shè)備，其核心功能是將220V直流電壓穩(wěn)定轉(zhuǎn)換為240V直流電壓，適用于工業(yè)自動(dòng)化、軌道交通、通信基站等對(duì)電…

06-23

石頭科技股價(jià)下跌引關(guān)注，泓德基金重倉(cāng)持股浮虧如何應(yīng)對(duì)？

今日股價(jià)的下滑引發(fā)市場(chǎng)關(guān)注，尤其是對(duì)重倉(cāng)該股的基金投資者而言，浮虧情況不容忽視。這表明泓德基金對(duì)石頭科技的信心，盡管短期內(nèi)面臨一定的浮虧。你覺(jué)得石頭科技的股價(jià)下滑是短期的調(diào)整，還是市場(chǎng)對(duì)智能硬件行業(yè)的長(zhǎng)期看…

06-23

Windows系統(tǒng)Chrome崩潰，竟是微軟家庭安全“誤傷”？

06-23

點(diǎn)擊查看更多 +

全站最新

太空算力新時(shí)代！軌道辰光完成融資，布局晨昏軌道巨型算力星座

2025款歐拉好貓家族新成員即將上市，能否打破月銷(xiāo)量千臺(tái)瓶頸？

2025車(chē)市新風(fēng)向：中大型SUV激戰(zhàn)，銀河M9能否超越理想i6成焦點(diǎn)？

奔馳CLA L純電版申報(bào)圖搶先看，800V平臺(tái)續(xù)航高達(dá)866km

我國(guó)兩大太陽(yáng)系觀測(cè)望遠(yuǎn)鏡項(xiàng)目青海冷湖正式啟動(dòng)！

小鵬G7下周上市，預(yù)售價(jià)23.58萬(wàn)起，配置豪華續(xù)航702km引期待

熱門(mén)內(nèi)容

本欄最新

南方電網(wǎng)新能源服務(wù)全解析：2025修訂版指南，項(xiàng)目推進(jìn)必備手冊(cè)！

路博潤(rùn)Lubrizol MF9145V添加劑：高效解決柴油車(chē)DPF養(yǎng)護(hù)挑戰(zhàn)

博世i-Hybrid旗艦店滬上啟航，探索高端舒適家居新境界

Ftrans文件擺渡系統(tǒng)：重塑企業(yè)跨網(wǎng)傳輸安全高效新生態(tài)

揚(yáng)州通華專(zhuān)用車(chē)喜獲江蘇省智能工廠稱(chēng)號(hào)，智能制造再添新榮耀！

工業(yè)制造數(shù)字化新篇章：千兆光網(wǎng)業(yè)務(wù)體驗(yàn)分級(jí)白皮書(shū)深度解讀

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類(lèi)資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶(hù)提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

阿里通義萬(wàn)相VACE開(kāi)源：視頻編輯迎來(lái)一站式創(chuàng)新模型

日本精品一区二区三区高清久久