近期,人工智能視頻生成領(lǐng)域迎來了一項重大突破,字節(jié)跳動公司低調(diào)推出了Seedance1.0模型,該模型在多項評測中的表現(xiàn)超越了備受矚目的谷歌Veo3。Veo3因其在音頻合成和電影級工具方面的創(chuàng)新而廣受好評,然而Seedance1.0的橫空出世,以其卓越的技術(shù)實力,重新定義了視頻生成的標(biāo)準(zhǔn)。
Seedance1.0的核心競爭力在于其創(chuàng)新的技術(shù)架構(gòu)。字節(jié)跳動的研發(fā)團(tuán)隊通過巧妙地解耦空間和時間層,并結(jié)合多模態(tài)位置編碼技術(shù),使得該模型能夠同時勝任文本到視頻和圖像到視頻的生成任務(wù)。這一突破性方法不僅支持復(fù)雜的場景轉(zhuǎn)換和多鏡頭敘事,還確保了生成內(nèi)容在主題上的一致性,為用戶帶來了前所未有的創(chuàng)作自由度。
在評測環(huán)節(jié),Seedance1.0展現(xiàn)出了其強大的實力。在與電影導(dǎo)演緊密合作的SeedVideoBench基準(zhǔn)測試中,該模型在遵循指令和動作真實感方面均取得了顯著優(yōu)勢。特別是在圖像到視頻的任務(wù)中,Seedance1.0能夠保持輸入幀的視覺一致性,而Veo3在某些情況下則出現(xiàn)了光照和紋理的不一致現(xiàn)象,這進(jìn)一步凸顯了Seedance1.0在視覺表現(xiàn)上的優(yōu)越性。
除了視覺效果上的卓越表現(xiàn),Seedance1.0在推理性能方面也同樣令人印象深刻。該模型能夠在極短的時間內(nèi)生成高質(zhì)量的1080p視頻,其生成速度遠(yuǎn)超同類競爭對手,如Sora、Runway Gen-4和Veo3。這一優(yōu)勢使得Seedance1.0在實時視頻生成領(lǐng)域具有巨大的潛力,為用戶提供了更加高效和便捷的創(chuàng)作體驗。
據(jù)悉,Seedance1.0計劃于2025年6月正式集成到字節(jié)跳動旗下的Doubao和Jimeng等平臺,旨在顯著提升專業(yè)工作流程和常規(guī)創(chuàng)作任務(wù)的效率。盡管Veo3在音頻合成方面取得了顯著進(jìn)展,結(jié)合了真實視頻與環(huán)境音效和對話,但Seedance1.0在視覺保真度、運動穩(wěn)定性和敘事連貫性方面的表現(xiàn)更為出色,盡管目前在音頻能力上還有待提升。