谷歌近日宣布,其代號(hào)為“Nano Banana”的圖像生成模型Gemini 2.5 Flash Image已正式投入商業(yè)應(yīng)用,開(kāi)始面向企業(yè)及開(kāi)發(fā)者提供授權(quán)服務(wù)。該模型在完成技術(shù)優(yōu)化后,現(xiàn)已通過(guò)Gemini App、Google AI Studio、Gemini API及Vertex AI等多平臺(tái)開(kāi)放訪問(wèn),同時(shí)新增圖片批量處理功能,進(jìn)一步提升了創(chuàng)作效率。
據(jù)內(nèi)部數(shù)據(jù)顯示,自今年8月底該模型開(kāi)啟預(yù)覽以來(lái),用戶(hù)參與度遠(yuǎn)超預(yù)期。僅在Gemini AI生態(tài)內(nèi),基于“Nano Banana”生成的圖像作品已突破50億次,覆蓋藝術(shù)創(chuàng)作、廣告設(shè)計(jì)、社交媒體內(nèi)容等多個(gè)領(lǐng)域。這一數(shù)據(jù)印證了市場(chǎng)對(duì)多場(chǎng)景圖像生成技術(shù)的強(qiáng)烈需求。
商業(yè)化方面,谷歌首次公布了定價(jià)策略:每100萬(wàn)個(gè)輸出Token收費(fèi)30美元(約合人民幣214元),按單張圖像平均消耗1290個(gè)Token計(jì)算,生成成本約為0.039美元/張(約合人民幣0.28元)。官方強(qiáng)調(diào),該模型已通過(guò)安全評(píng)估,符合生產(chǎn)環(huán)境部署標(biāo)準(zhǔn),并受商業(yè)條款保護(hù),確保用戶(hù)數(shù)據(jù)與創(chuàng)作內(nèi)容的合規(guī)性。
功能升級(jí)是此次發(fā)布的核心亮點(diǎn)。相較于預(yù)覽版僅支持16:9單一比例,正式版模型擴(kuò)展至10種長(zhǎng)寬比,包括21:9(電影寬屏)、9:16(豎版短視頻)、1:1(社交媒體配圖)等,覆蓋從影視制作到移動(dòng)端內(nèi)容的全場(chǎng)景需求。開(kāi)發(fā)者可通過(guò)參數(shù)調(diào)整,快速適配不同平臺(tái)的視覺(jué)規(guī)范,減少后期裁剪的工作量。
技術(shù)團(tuán)隊(duì)透露,模型優(yōu)化重點(diǎn)在于平衡生成質(zhì)量與計(jì)算效率。通過(guò)改進(jìn)注意力機(jī)制和分層渲染算法,新版本在保持圖像細(xì)節(jié)的同時(shí),將推理速度提升了30%。批量處理功能支持同時(shí)生成多組不同比例的圖像,顯著提升了商業(yè)項(xiàng)目中的內(nèi)容產(chǎn)出效率。











