谷歌今日正式發(fā)布新一代視頻生成模型Veo 3.1,在畫(huà)面真實(shí)度、敘事控制及多模態(tài)生成能力方面實(shí)現(xiàn)突破。該模型同步賦能旗下AI影視創(chuàng)作平臺(tái)Flow,新增音頻生成功能,支持從文本到"聲畫(huà)合一"的完整創(chuàng)作流程。
Flow平臺(tái)此次升級(jí)聚焦三大核心功能:素材生視頻(Ingredients to Video)支持多圖參考生成定制化視頻,首尾幀(frames to Video)可自動(dòng)生成過(guò)渡鏡頭,視頻延展(Extend)功能則能將短片擴(kuò)展至分鐘級(jí)長(zhǎng)視頻。最引人注目的是AI音頻生成系統(tǒng)的加入,該系統(tǒng)可根據(jù)畫(huà)面內(nèi)容自動(dòng)匹配環(huán)境音、動(dòng)作音效及氛圍配樂(lè),實(shí)現(xiàn)真正的多媒體創(chuàng)作。
針對(duì)后期編輯需求,F(xiàn)low新增智能元素插入工具,可自然融入人物、動(dòng)物等新元素并自動(dòng)調(diào)整光影效果。即將上線的一鍵移除功能支持無(wú)痕刪除對(duì)象,系統(tǒng)會(huì)自動(dòng)重建背景畫(huà)面。這些工具使創(chuàng)作者能更精準(zhǔn)地控制最終效果。
技術(shù)測(cè)試顯示,Veo 3.1在復(fù)雜光影場(chǎng)景中表現(xiàn)突出,能準(zhǔn)確還原清晨光線的暖色調(diào)與自然氛圍。實(shí)測(cè)生成的小溪畫(huà)面水流平滑,反光細(xì)節(jié)處理得當(dāng),配音與畫(huà)面內(nèi)容高度契合。模型提供快速版(30秒-1分鐘生成)和高質(zhì)量版兩種模式,滿(mǎn)足不同創(chuàng)作需求。
但在高難度動(dòng)態(tài)場(chǎng)景測(cè)試中,模型暴露出明顯局限。當(dāng)嘗試生成體操動(dòng)作視頻時(shí),輸出畫(huà)面出現(xiàn)嚴(yán)重扭曲,無(wú)法準(zhǔn)確呈現(xiàn)人體結(jié)構(gòu)。名人肖像測(cè)試也顯示保護(hù)機(jī)制生效,上傳OpenAI CEO照片生成的畫(huà)面存在顯著差異,系統(tǒng)提示不支持使用特定人物形象。
目前Veo 3.1已通過(guò)Flow平臺(tái)、Gemini API、Vertex AI及Gemini應(yīng)用全面開(kāi)放,免費(fèi)用戶(hù)每月可獲100個(gè)AI點(diǎn)數(shù),約可生成5條視頻。廣告短片測(cè)試表明,模型能根據(jù)咖啡杯、人像等素材生成符合品牌調(diào)性的商業(yè)內(nèi)容,廣告詞呈現(xiàn)效果達(dá)到預(yù)期要求。









