阿里巴巴在AI技術(shù)領(lǐng)域再次邁出重要一步,正式向公眾開源了其最新的通義萬相Wan2.1-VACE模型。這款模型不僅支持視頻生成,還涵蓋了視頻編輯的多項功能,展現(xiàn)了強(qiáng)大的技術(shù)實力。
通義萬相Wan2.1-VACE模型是阿里巴巴在AI繪畫創(chuàng)作大模型系列中的又一力作。它集文生視頻、圖像參考視頻生成、視頻重繪、視頻局部編輯、視頻背景延展以及視頻時長延展等多種基礎(chǔ)生成和編輯能力于一身,為用戶提供了全方位的視頻創(chuàng)作和編輯解決方案。
據(jù)了解,此次開源的版本包括1.3B和14B兩個不同規(guī)模的模型,其中1.3B版本尤其值得關(guān)注,因為它能夠在消費級顯卡上流暢運(yùn)行,大大降低了使用門檻,使得更多用戶能夠體驗到這款先進(jìn)的AI模型。
通義萬相系列模型自2023年7月7日正式上線以來,便以其出色的圖片創(chuàng)作能力贏得了廣泛關(guān)注。而在2024年9月的阿里云棲大會上,阿里巴巴更是發(fā)布了通義萬相視頻生成大模型,該模型不僅能夠生成影視級高清視頻,還對中國語言有著更深入的理解,進(jìn)一步提升了其實用性和用戶體驗。
在今年年初,通義萬相視頻生成模型已經(jīng)升級至2.1版,整體性能得到了大幅提升。特別是在處理復(fù)雜運(yùn)動、還原真實物理規(guī)律、提升電影質(zhì)感以及優(yōu)化指令遵循方面,該模型取得了顯著的進(jìn)展,為用戶帶來了更加真實、細(xì)膩的視頻創(chuàng)作體驗。
而此次全面開源萬相2.1模型,更是阿里巴巴在AI技術(shù)開放共享方面邁出的重要一步。通過開源,阿里巴巴希望能夠吸引更多的開發(fā)者和技術(shù)愛好者加入到AI技術(shù)的研究和應(yīng)用中來,共同推動AI技術(shù)的創(chuàng)新和發(fā)展。