在科技界的聚光燈下,谷歌再次成為焦點。自2022年末生成式AI浪潮興起以來,谷歌一直被視為OpenAI的強勁對手,盡管期間不乏被戲稱為“AI界的汪峰”,總被對手的光芒所掩蓋。然而,在2025年的I/O大會上,谷歌似乎終于迎來了它的高光時刻。
此次大會上,谷歌一口氣推出了十多款新產品和功能,包括升級后的基礎模型Gemini 2.5 Flash、AI搜索模式(AI Mode)、全新硬件谷歌眼鏡以及Agent等。其中,最引人矚目的莫過于最新的AI視頻模型Veo3及其配套的AI視頻創作平臺Flow。
Gemini 2.5 Flash憑借其強大的推理能力和更快的響應速度脫穎而出,AI Mode則支持連續對話和查詢,而圖片模型Imagen 4則是為了與GPT-4的生圖功能一較高下。然而,Veo3及其配套的Flow平臺無疑是此次發布中最具顛覆性的存在。
Flow平臺專注于“視頻編輯與剪輯”,集成了谷歌最新的基礎模型Gemini、Imagen4以及視頻生成模型Veo3。Veo3的最大亮點在于其原生音頻同步功能,能夠一鍵生成包含人物對白、音效和環境音的有聲視頻,且效果自然逼真,令人難以置信。
DeepMind的創始人Demis Hassabis在大會上直言:“Veo3結束了視頻生成的無聲時代。”以往繁瑣的“圖生視頻”工作流程,如今只需Veo3就能輕松實現,從畫面到口型再到場景音效,一應俱全。
Veo3發布后,眾多創作者紛紛在社交媒體上曬出了他們使用Veo3制作的首個視頻。這些視頻涵蓋了不同場景和人物,說著同樣的“We Can Talk”,看似真實電影混剪,實則是由AI一鍵生成的視頻片段組合而成。其中一位創作者僅花費2小時就用Veo3制作了這樣一條視頻,瀏覽量迅速突破47萬,網友們紛紛留言表示震驚和不可思議。
Veo3不僅能輕松制作小貓擬人播客視頻,還能應對復雜對話的雙人出鏡街采視頻。視頻畫面幾乎看不出瑕疵,人物對話時的表情、動作甚至背景環境變化都栩栩如生,仿佛是真實實拍的素材。
然而,如此強大的功能背后,是谷歌“史上最貴”的AI會員費用。只有月訂閱費高達249美元(折合人民幣約1800元)的“Ultra Tier”會員,才能享受Veo3等最新功能。這一價格足以將大多數普通AI玩家拒之門外。
盡管價格高昂,但Veo3的驚艷表現仍然引發了廣泛關注和討論。我們實測后發現,Veo3不僅能一鍵生成視頻,還能實現音畫同步,大大簡化了視頻制作的流程。然而,在實測過程中也發現了一些不足,如文字字幕偶爾出錯,以及對于超現實主義場景的還原存在瑕疵。
盡管如此,Veo3的出現仍然對AI視頻生成賽道以及垂類數字人產品、AI剪輯應用等構成了威脅。它讓AI視頻創作進入了新的發展階段,對視覺和聲音的交互有了新的理解。對于視頻創作者而言,Veo3的“一鍵直達”功能無疑具有巨大的吸引力。
目前,Veo3模型已經在Gemini應用中面向Google AI Ultra訂閱用戶開放,Ultra會員也可以在Flow平臺直接使用Veo3。我們期待在未來看到更多由Veo3創作的精彩視頻作品。