曹越老師團隊旗下的Sand.ai近日發布了一款名為GAGA-1的全新AI視頻生成模型,主打音畫同步功能,并于上線首日向所有用戶免費開放。這款模型無需邀請碼或排隊,用戶可直接通過官網體驗其核心功能。
據研發團隊介紹,GAGA-1的研發周期長達6個月,遠超最初計劃的2個月。其核心優勢集中在人物表演領域,尤其是帶臺詞的影視級內容生成。模型已能適配短劇、影游場景,部分功能可滿足電視劇需求,但尚未達到電影級表現。
目前,GAGA-1僅開放“Gaga Actor”功能,畫幅固定為16:9,支持5秒和10秒兩種視頻時長。用戶需提供圖片和文字描述作為輸入,生成時間約3-4分鐘。該模型對中英文臺詞的支持較為出色,能夠精準還原失望、憤怒等復雜情緒,并支持雙人場景互動。
在特色功能方面,GAGA-1不僅能識別外國人形象并生成帶有口音的普通話,還具備唱歌能力。然而,模型也存在一些局限性,例如大幅動作可能導致肢體變形,過長提示詞可能被忽略,日文支持效果不佳,且無法自定義上傳音頻或固定音色。
GAGA-1自帶的Banana畫圖功能在生成亞洲人像時審美表現一般,建議用戶搭配Seedream 4.0使用以獲得更好效果。盡管如此,這款模型仍為低成本視頻創作提供了新的可能性,尤其適用于短劇制作、影游NPC對話生成以及小說角色可視化等場景。
關于未來規劃,研發團隊透露,自定義音頻和固定音色功能已接近完成,但因工程進度原因未納入此次發布。價格方面,雖然免費使用期限尚未確定,但明確表示后續定價將遠低于Sora2和Veo3等同類產品。











