滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

阿里開源全能視頻編輯模型，蒙娜麗莎橫屏變酷玩墨鏡

時間：2025-05-15 02:08:21 來源：ITBEAR編輯：快訊團隊 發表評論無障礙通道

近日，阿里巴巴旗下的通義萬相團隊宣布了一項重大技術進展，正式開源了名為Wan2.1-VACE的視頻編輯與生成統一模型。這一創新成果在視頻處理領域引起了廣泛關注，被視為業界功能最為全面的視頻生成與編輯解決方案。

Wan2.1-VACE模型以其強大的多功能性著稱，能夠在一個單獨的模型架構內實現多種視頻處理任務。這包括從文本生成視頻、基于圖像參考的視頻生成、視頻重繪、局部編輯、背景延展以及時長延展等。更令人矚目的是，它還支持多任務組合生成，這意味著用戶可以在一個流程中完成多個復雜的視頻編輯操作。

該模型基于通義萬相V2.1平臺開發，提供了1.3B和14B兩種參數規模的版本以滿足不同需求。輕量級的1.3B版本能夠在消費級顯卡上流暢運行，支持480P視頻輸出；而14B的滿血版則支持更高的分辨率，包括480P和720P，并提供更優質的處理效果。開發者可以通過GitHub、Huggingface以及魔搭社區等平臺下載并體驗這一模型。

在實際應用中，Wan2.1-VACE展現出了極高的靈活性和實用性。例如，它可以將一幅豎版的《蒙娜麗莎》靜態圖像轉換為橫版動態視頻，并根據另一幅參考圖像為其添加眼鏡，這一過程同時完成了畫幅擴展、時長延展和圖像參考三項任務。這種能力不僅簡化了視頻創作的流程，還極大地拓寬了創意的邊界。

該模型的核心優勢在于其支持多任務靈活組合處理的能力。傳統上，完成類似的視頻編輯任務可能需要多個模型串聯工作，流程復雜且效率低下。而Wan2.1-VACE則通過單一模型實現了任意基礎能力的自由組合，用戶無需針對特定功能訓練新的專家模型，即可完成更復雜的任務。

Wan2.1-VACE在技術創新方面也取得了顯著突破。它引入了全新的視頻條件單元VCU，這一創新設計在輸入形態上統一了文生視頻、參考圖生視頻、視頻生視頻以及局部視頻生視頻四大類視頻生成和編輯任務。VCU將多模態的各類上下文輸入轉化為文本、幀序列和Mask序列三大形態，從而實現了多任務自由組合的技術基礎。

在解決多模態輸入難題方面，Wan2.1-VACE也展現出了其獨特的優勢。它將VCU輸入的幀序列進行概念解耦，分別重構為可變序列和不可變序列后進行編碼，從而有效解決了token序列化的問題。

隨著Wan2.1-VACE的開源，視頻生成技術正迎來從單任務向多任務組合邁進的重要階段。這一創新成果不僅為視頻創作者提供了更為便捷和高效的工具，也為視頻處理領域的未來發展開辟了新的道路。

舉報 0 收藏 0 打賞 0評論 0

05-20

“四川芬達”直播預告又現楊坤模仿，此前曾宣布不再模仿引關注

5月19日，網紅“四川芬達”發布了一條將于21日晚直播的預告視頻。不過，在這條預告視頻中，四川芬達仍然以模仿楊坤唱歌形式宣布開播時間。此前，在楊坤表示要起訴后，四川芬達連續多次發文致歉，并且宣布不僅將網名…

05-20

哈洽會上牡丹江農產品大放異彩，中外客商爭相采購

05-20

鳳陽鼓樓大修紀實：去年斥資290余萬重現古韻

05-20

小米自研芯片玄戒O1跑分曝光：10核3nm設計，能否超越驍龍8 Gen 3？

05-20

傳激光雷達企業禾賽科技赴港上市現金流遠超同行

發布 | ITBEAR2025年5月16日，中國激光雷達龍頭企業禾賽科技被曝已秘密提交香港上市申請，可能于今年完成上市。消息一出，禾賽美股盤前股價一度飆升7%。這一動作不僅讓外界看到中國硬科技企業的資本布局野心，更揭示了激光雷達行業從“燒錢求生”到“盈利破局”的關鍵轉

05-20

英偉達TensorRT AI推理加速登陸GeForce RTX，性能倍增引期待！

05-20

微軟推出Magentic-UI：你的透明可控AI網絡助手來了！

05-20

華碩ProArt RTX 5080顯卡來襲：北歐風木紋+USB-C接口，創意人士新寵？

05-20

阿里健康2025財年成績單：總收入破300億，凈利潤大漲62.2%

新榜訊 5 月 19 日，港交所傳來消息，阿里健康發布公告稱，2025 財年總收入達 305.98 億元，同比增幅為13.2%。在報告期內，凈利潤達 14.32 億元，同比增長 62.2%。…

05-20

妙多AI2.0升級：人機協作新時代，共繪設計新篇章

05-20

油價十連調再現大降，私家車加滿一箱油少花9元！

計入本輪調整后，今年國內油價調整呈現“三漲五降兩擱淺”格局，年內汽油累計下調655元/噸，柴油累計下調630元/噸。值得一提的是，今年五次油價下調中，已有三次汽、柴油價格雙雙下調200元/噸以上，其中，3月…

05-20

便利店十年變遷：跨界競爭下，如何重塑“便利”新價值？

本文從便利店大會歷年主題的演進中提煉變革脈絡，結合筆者在不同地區便利商店實務操作的觀察與省思，思考在這場跨界共舞的未來里，便利商店如何重新定義價值、創新邊界，并走出「不只是便利」的新路線圖。無論是7-EL…

05-20

日式餐飲卷土重來，這屆日料為何又火了？

壽司郎創立于 1984 年，是日本著名的平價餐飲品牌。壽司郎不是單例，同為日系平價餐飲連鎖品牌出身的濱壽司、薩莉亞等，近年來也在中國市場迎來了“第二春”。相反，壽司郎、濱壽司、薩莉亞等網紅品牌在加快拓店…

05-20

攜程2025年Q1財報亮眼：營收138億

攜程集團近日發布了其2025年第一季度的財務報告，數據顯示該季度業績強勁增長。報告顯示，攜程在這一季度的凈營業收入達到了138億元人民幣，與去年同期相比增長了16%，與前一季度相比則增長了9%。歸屬于攜程集團股東的凈利潤更是達到了43億元人民幣。

05-20

點擊查看更多 +

全站最新

2025款極星4：漲價增配后能否打破“叫好不叫座”魔咒？

日產巨虧后能否翻身？N7能否成為日產新能源的自救關鍵？

2025華中國際車展盛況空前，新能源智能科技引領潮流圓滿閉幕！

航空科技閃耀！中航工業機載公司亮相先進技術成果轉化盛會

清華EE85班再造AI芯片巨頭，燧原科技估值160億沖刺IPO

哈洽會上牡丹江農產品大放異彩，中外客商爭相采購

熱門內容

本欄最新

“四川芬達”直播預告又現楊坤模仿，此前曾宣布不再模仿引關注

哈洽會上牡丹江農產品大放異彩，中外客商爭相采購

鳳陽鼓樓大修紀實：去年斥資290余萬重現古韻

英偉達TensorRT AI推理加速登陸GeForce RTX，性能倍增引期待！

微軟推出Magentic-UI：你的透明可控AI網絡助手來了！

華碩ProArt RTX 5080顯卡來襲：北歐風木紋+USB-C接口，創意人士新寵？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

阿里開源全能視頻編輯模型，蒙娜麗莎橫屏變酷玩墨鏡

日本精品一区二区三区高清久久