谷歌旗下圖像生成模型Nano Banana迎來重大升級,新一代產品Nano Banana Pro正式亮相。這款基于Gemini 3 Pro架構開發的模型,在文字渲染、細節表現和多語言支持等方面實現了突破性進展,為創意產業和辦公場景帶來全新工具。
今年8月推出的初代Nano Banana憑借將2D照片轉化為3D手辦效果的功能迅速走紅,推動Gemini應用月活躍用戶數在三個月內從4.5億增長至6.5億。此次升級版不僅延續了前代的視覺轉換能力,更在文本生成、圖像編輯和跨語言處理等維度實現質的飛躍。
核心升級體現在文字處理能力上。新模型可精準生成從簡短標語到長段落的多語言文本,支持超過200種語言的實時翻譯與本地化。通過增強的書法渲染引擎,用戶能自定義字體風格、紋理效果和排版布局,確保文字在復雜背景中依然清晰可讀。測試顯示,在飲料包裝、電影分鏡等場景中,文字生成準確率較前代提升47%。
編輯功能迎來全面革新。用戶現在可以動態調整相機視角、光線強度、景深效果等參數,支持16:9至1:1等九種常見縱橫比切換。分辨率上限從1024×1024提升至4K級別,滿足專業設計需求。特別開發的角色一致性算法,允許在單張幻燈片中保持最多五個角色的視覺統一性,每個角色可生成多達14種不同姿態的圖像。
辦公場景應用成為新亮點。谷歌宣布將該模型深度整合至Workspace辦公套件,用戶可直接在PPT中生成信息圖表,系統自動匹配主題色調與字體風格。針對創意工作者開發的"可視化知識庫"功能,能將豆蔻茶制作等步驟轉化為分步動畫,支持添加交互式熱點注釋。
技術團隊透露,新模型通過引入互聯網實時檢索模塊,使生成內容具備動態更新能力。當用戶要求制作節日主題海報時,系統會自動關聯當前日期并推薦相關設計元素。在多模態處理測試中,模型成功將用戶手繪草圖轉化為包含中英雙語說明的商業海報,整個過程耗時不足8秒。
訪問權限方面,谷歌采取分級開放策略。免費用戶可在Gemini應用中體驗基礎功能,每日生成配額為5次;AI Plus訂閱用戶配額提升至20次,支持4K分辨率輸出;最高階的Ultra用戶則享有無限次使用權,并可優先體驗Flow電影制作工具中的3D場景生成功能。所有用戶生成的圖像都將自動添加數字水印,便于版權追溯。











