近日,谷歌在生成式視頻領域動作頻頻,備受矚目的VEO3.1模型即將面向公眾發(fā)布。有跡象顯示,谷歌正通過Gemini應用程序逐步向廣大用戶展示VEO3.1的強大功能,用戶有望在熟悉的Gemini界面中直接體驗這一創(chuàng)新成果。
社交媒體平臺X上,知名社區(qū)人士Logan Kilpatrick發(fā)布的相關帖子引發(fā)廣泛關注,被外界視為谷歌AI新產(chǎn)品即將問世的早期信號。與此同時,Vertex AI平臺中出現(xiàn)了“VEO3.0Generate”和“VEO3.0Fast Generate”等預覽模型的引用,表明谷歌正通過多渠道為早期用戶和企業(yè)用戶提供接觸機會,這一策略與其過往發(fā)布生成工具時的做法一脈相承。
關于VEO3.1的核心性能,社區(qū)討論聚焦于視頻輸出時長的升級。有證據(jù)表明,新模型可能將視頻時長從之前的8秒大幅延長至30秒,盡管這一數(shù)據(jù)尚未得到官方確認。若屬實,創(chuàng)作者將獲得更廣闊的敘事空間,尤其對需要長鏡頭或復雜情節(jié)的視頻制作意義重大。泄露信息顯示,VEO3.1在快速模式下可能犧牲部分質(zhì)量以換取效率,而標準模式則有望解鎖更高清晰度與視覺效果,滿足專業(yè)創(chuàng)作者對品質(zhì)的追求。
此前測試中,VEO3.1已展現(xiàn)出顯著進步。例如,其生成的720p視頻不僅畫面質(zhì)量提升,還新增了音頻生成能力,這一改進使其在與Sora2等競品的對比中更具競爭力。TestingCatalog的報道指出,VEO3.1在視覺效果和音頻同步方面的優(yōu)化,標志著谷歌在生成式媒體技術上的又一次突破。
從戰(zhàn)略層面看,谷歌正將Gemini打造為集多功能于一體的中央工作區(qū),而VEO模型作為核心組件,將同時服務于消費者和企業(yè)用戶。通過Vertex AI的預覽發(fā)布,企業(yè)客戶可提前測試視頻生成功能;而Gemini應用程序的推廣,則確保普通用戶能無縫接入。這種分階段、分用戶的發(fā)布策略,既能高效收集開發(fā)者反饋,又能逐步培養(yǎng)公眾接受度,與谷歌鞏固生成媒體領域地位的長期目標高度契合。
劃重點:







