當(dāng)GPT初現(xiàn)時(shí),曾有聲音預(yù)言搜索引擎和谷歌的未來岌岌可危。然而,時(shí)間來到當(dāng)下,人們發(fā)現(xiàn),在AI大模型領(lǐng)域站穩(wěn)腳跟的,恰恰是谷歌。近期,谷歌推出的Gemini 3 Pro模型,憑借其強(qiáng)大的性能,引發(fā)了廣泛關(guān)注,甚至被形容為“活成了山姆·奧特曼理想中的樣子”。
谷歌并未止步于此,緊接著又發(fā)布了最新的畫圖模型——Nano Banana Pro。這一模型在推特上收獲了一致好評(píng),成為AI繪圖領(lǐng)域的新焦點(diǎn)。實(shí)際體驗(yàn)發(fā)現(xiàn),這款模型的表現(xiàn)令人驚嘆,幾乎讓其他同類產(chǎn)品黯然失色。
Nano Banana Pro的強(qiáng)大之處在于其簡(jiǎn)潔的操作方式。用戶只需用簡(jiǎn)單的語言描述需求,模型便能自動(dòng)理解并生成符合要求的圖片。例如,生成一張推特互動(dòng)流截圖,只需一句話提示,模型便能準(zhǔn)確呈現(xiàn)點(diǎn)贊、評(píng)論和互動(dòng)內(nèi)容,甚至能將英文討論翻譯成中文顯示。同樣,生成一張Windows 11的電腦截屏,只需描述桌面、瀏覽器和新聞內(nèi)容,模型便能精準(zhǔn)還原細(xì)節(jié),包括左下角的時(shí)間。
這款模型的模仿能力同樣出色。無論是生成米老鼠大戰(zhàn)哆啦A夢(mèng)的漫畫,還是制作百事可樂與可口可樂的聯(lián)名海報(bào),Nano Banana Pro都能輕松應(yīng)對(duì)。它甚至能理解版權(quán)要求,使用1928年版的米老鼠形象,并生成黑白或彩色漫畫。在游戲畫面截圖方面,模型的表現(xiàn)也幾乎毫無破綻,無論是《原神》的璃月場(chǎng)景,還是《英雄聯(lián)盟》的亞索對(duì)戰(zhàn),都能以假亂真。
Nano Banana Pro對(duì)圖片和中文的理解能力堪稱卓越。它不僅能將漫畫中的外文翻譯成中文,還能將文字放置在正確的位置,完成漢化工作。模型還具備強(qiáng)大的思考能力。在生成圖片前,它會(huì)先構(gòu)建整體框架,再查找相關(guān)元素,最終整合成一張完整的圖片。例如,生成NS主機(jī)菜單欄界面時(shí),模型會(huì)先設(shè)計(jì)用戶界面,再添加游戲UI,確保細(xì)節(jié)無誤。
這種深度思考能力讓Nano Banana Pro能夠完成更復(fù)雜的任務(wù)。例如,制作圖文并茂的番茄炒蛋教程,或回顧小米汽車的發(fā)展歷程,模型都能生成內(nèi)容豐富、細(xì)節(jié)精準(zhǔn)的圖片。即使偶爾出現(xiàn)小瑕疵,不仔細(xì)觀察也難以發(fā)現(xiàn)。
Nano Banana Pro的發(fā)布,大幅降低了AI繪圖的門檻,同時(shí)提升了圖片的真實(shí)性。對(duì)于設(shè)計(jì)師而言,這不僅是挑戰(zhàn),更是機(jī)遇。目前,用戶可以通過谷歌的Gemini、AI Studio或Google Cloud體驗(yàn)這款模型。國內(nèi)平臺(tái)如PixVerse也已接入Nano Banana Pro,用戶可直接使用,無需復(fù)雜操作。
除了繪圖功能,PixVerse還整合了其他熱門模型,如Qwen-image和Seedream4.0,方便用戶進(jìn)行對(duì)比測(cè)試。平臺(tái)還支持視頻生成模型,用戶可將Nano Banana Pro生成的圖片一鍵轉(zhuǎn)換為視頻,為自媒體、漫劇和廣告行業(yè)提供便利。使用V5 Fast模式后,僅需不到一分鐘,便能生成一段1080P的五秒帶音效視頻。











