谷歌在本周的年度開發者盛會上,正式揭曉了其DeepMind團隊研發的AI視頻生成工具——Veo 3的最新版本。這一創新技術不僅將視頻生成推向了新的高度,還引入了前所未有的音頻合成能力。
Veo 3能夠生成具備高分辨率電影質感的視覺內容,同時融入逼真的音頻效果,包括細膩的環境聲、特效音以及流暢的語音對話。這一特性使其在眾多同類工具中獨樹一幟,為用戶帶來了前所未有的沉浸式體驗。
與市場上現有的其他產品,如OpenAI的Sora、meta的MovieGen以及Runway的Gen-4相比,Veo 3的最大亮點在于其音頻與視覺的完美融合。這一獨特優勢引發了社交媒體上的廣泛討論,許多用戶紛紛表示,他們幾乎無法分辨出眼前的視頻是由AI生成還是真實拍攝。
DeepMind的聯合創始人兼首席執行官戴米斯·哈薩比斯在發布會上表示,Veo 3在直觀物理建模方面的表現令人驚嘆。他進一步指出,這一技術突破有望為理解宇宙的復雜性提供新的視角和見解。
特斯拉CEO埃隆·馬斯克也對Veo 3給予了高度評價,稱贊其是一項出色的工作。馬斯克此前就曾對谷歌的Veo 2表示過欽佩,此次再次對Veo 3表示贊賞,顯示出他對谷歌在AI視頻生成領域的進步持高度認可態度。
然而,盡管馬斯克對谷歌的視頻模型贊不絕口,但他對谷歌的另一款AI模型Gemini卻持保留意見。馬斯克曾指責Gemini存在偏見問題,對其表示擔憂。
與此同時,本周早些時候有消息傳出,馬斯克的人工智能公司xAI正計劃進行一項重大投資,準備在孟菲斯附近部署100萬個GPU。這一舉措無疑將為英偉達等GPU制造商帶來巨大的商業機遇。