稀宇科技近期在視頻生成技術領域取得了突破性進展,隆重推出了其最新的視頻生成模型——Hailuo02。這款模型在處理諸如體操動作等高難度場景時,展現出了卓越的性能,成為全球首個能夠實現此類復雜效果的視頻生成模型。
自去年8月底稀宇科技發布視頻生成模型Demo網頁以來,其海螺視頻產品便受到了廣大創作者的熱烈歡迎。據統計,該產品已助力創作者生成了超過3.7億個視頻。此次Hailuo02的推出,不僅進一步降低了視頻創作的門檻,還顯著提升了創作的質量。
Hailuo02的核心競爭力在于其獨特的Noise-aware Compute Redistribution(NCR)架構。這一架構在保持參數量級不變的情況下,將訓練和推理效率提升了2.5倍。這意味著,在不增加創作者使用成本的前提下,可以采用更大的參數規模,從而使模型的表現力更加出色。同時,得益于推理優化的空間,Hailuo02的總參數量相較于上一代模型擴大了三倍。
憑借更大的參數量和更高的訓練效率,Hailuo02能夠處理更多的數據。結合創作者對Hailuo01的反饋,稀宇科技對數據量進行了大幅擴充,達到了上一代模型的四倍,同時數據的質量和多樣性也得到了顯著提升。這使得新模型在復雜指令遵循和復雜物理表現方面取得了顯著進步,能夠準確響應復雜指令,讓創作者的精心構思得到更好的呈現。創作者還能以更加實惠的價格生成原生的1080p視頻。
在Artificial Analysis Video Arena的測試中,Hailuo02的一個早期版本便取得了全球第二的優異成績。目前,該模型已在海螺視頻的Web端、APP端以及開放平臺API中全面更新,提供了包括768p-6秒、768p-10秒和1080p-6秒在內的三個版本。稀宇科技一直致力于為創作者提供業內最優的價格,并將繼續在提升生成速度、優化偏好對齊、實現高階功能以及探索技術與藝術結合的極限等方面進行快速迭代和更新。