谷歌旗下AI應(yīng)用Gemini近期在全球多國應(yīng)用商店榜單中登頂,包括美國、印度、加拿大及摩洛哥等地,一舉打破ChatGPT長期占據(jù)的領(lǐng)先地位。這一成績被業(yè)內(nèi)視為谷歌在生成式AI領(lǐng)域的重要突破,其核心驅(qū)動力源于8月推出的圖像生成工具Nano Banana——這款免費工具上線不足一月,便推動Gemini新增用戶2300萬,累計生成圖片超5億張。
Nano Banana的爆發(fā)式增長與其高度可玩性密切相關(guān)。用戶可通過精細(xì)提示詞實現(xiàn)風(fēng)格遷移、場景重構(gòu)等創(chuàng)意操作,例如將普通照片轉(zhuǎn)化為美式證件照、讓2D角色化身漫展Coser,甚至生成破碎感肖像或像素風(fēng)游戲形象。技術(shù)層面,該工具支持物體3D全息化、素描姿勢精準(zhǔn)匹配等復(fù)雜功能,還能用于制作微縮模型、城市景觀等高難度場景。DeepMind CEO哈薩比斯公開稱贊其為“同類最佳”,Vercel等科技公司高管亦在社交媒體分享使用案例。
從應(yīng)用生態(tài)看,谷歌通過Gemini系列逐步構(gòu)建技術(shù)壁壘。Gemini 1.5將上下文處理能力提升至百萬量級,2.0版本被評價為“部分超越GPT-4”,2.5 Pro則在代碼與邏輯推理領(lǐng)域表現(xiàn)突出。更關(guān)鍵的是,谷歌將AI模型深度整合至搜索、Chrome、YouTube等核心產(chǎn)品,形成覆蓋數(shù)十億用戶的生態(tài)網(wǎng)絡(luò)。這種“技術(shù)+場景”的雙輪驅(qū)動策略,使其從追趕者轉(zhuǎn)變?yōu)樾袠I(yè)規(guī)則制定者。
行業(yè)格局因此發(fā)生微妙變化。回溯至OpenAI成立初期,馬斯克曾透露其目標(biāo)之一便是制衡谷歌在AI領(lǐng)域的壟斷地位。然而ChatGPT爆紅后,谷歌長期處于被動應(yīng)對狀態(tài),Bard等初期產(chǎn)品因體驗不佳飽受詬病。此次Gemini反超,恰逢馬斯克指控蘋果操縱應(yīng)用排名、偏袒ChatGPT打壓競品Grok,網(wǎng)友戲稱谷歌登頂為“打破應(yīng)用市場操控的實證”。
技術(shù)社區(qū)正掀起Nano Banana創(chuàng)作熱潮。用戶開發(fā)出多樣化提示詞模板,涵蓋真實攝影(如85mm鏡頭人像特寫)、品牌設(shè)計(極簡咖啡杯LOGO)、虛擬場景(怪物對戰(zhàn)游戲畫面)等領(lǐng)域。官方推薦的六大類玩法中,產(chǎn)品攝影提示詞需精確到材質(zhì)描述(如“拋光混凝土上的啞光陶瓷杯”),漫畫創(chuàng)作則強調(diào)光影對比與敘事張力。這種“提示詞工程”的流行,標(biāo)志著AI工具從功能實現(xiàn)轉(zhuǎn)向藝術(shù)表達(dá)的新階段。