科技領域迎來新動態,谷歌計劃在Gemini平臺推出一項名為Nano Banana Pro的創意功能升級,主要面向設計師、營銷人員及教育工作者群體。用戶可通過Gemini應用中的“Thinking”模型直接使用該功能,其核心亮點在于強大的布局控制能力。
在圖像生成方面,該功能支持用戶生成最高達4K分辨率的圖像,并且能夠自由設定多種縱橫比。從適用于演示和印刷品的16:9,到適配社交媒體帖子的9:16,多樣化的比例設置可確保輸出內容直接滿足不同發布渠道的規格要求,無需創作者后期額外調整。
此次升級的一大技術突破是引入了“高級文本渲染”技術。這一技術極大地提升了圖像中文字和拼寫的精準度,能夠清晰生成包含復雜文本的海報、菜單、邀請函,甚至數據密集型信息圖。對于需要大量文字展示的創意設計場景,該技術無疑提供了有力支持。
Nano Banana Pro還對概念設計流程進行了優化。用戶只需上傳一張二維草圖,再通過提示詞,就能讓Gemini將其渲染成具有照片級真實感的三維產品圖像。這一功能方便創作者探索不同材質和光影效果,為產品設計的初期階段提供了更直觀、高效的呈現方式,有助于快速迭代設計方案。
在圖像編輯與合成領域,該功能同樣實現了顯著增強。它支持用戶同時上傳多達六張圖片,進行場景融合或元素提取。例如,創作者可以將不同場景中的元素組合在一起,創造出全新的視覺效果;或者從多張圖片中提取特定元素,用于新的創作中,極大地豐富了創作的可能性。
其中,“風格遷移”功能可以將參考圖像的調色板或整體視覺風格應用到另一張照片上,讓創作者能夠快速實現風格的統一或轉換。而更具創新性的“畫布引導”功能,允許用戶直接在上傳的圖片上通過涂鴉、畫圈或注釋等方式下達視覺指令。這種直觀的交互方式,讓AI能夠更準確地理解創作者的修改意圖,并快速執行相應操作。
與早前發布的版本相比,Nano Banana Pro的核心價值在于將多圖像合成、高可靠性排版以及縱橫比控制等關鍵功能整合進單一工作流中。這種集成化設計有效減少了創作者在不同專業軟件之間來回切換的繁瑣操作,避免了因軟件切換導致的工作流程中斷和數據丟失等問題,顯著提升了工作效率,為創意工作者提供了更加便捷、高效的創作工具。











