谷歌近日正式上線了其最新旗艦?zāi)P虶emini 3 Pro,這款被公司稱為迄今為止“最智能”且“最準(zhǔn)確”的模型,不僅在編碼和推理能力上實現(xiàn)了顯著提升,還大幅減少了“諂媚式”回應(yīng),轉(zhuǎn)而提供更加直接和實用的信息。這一舉措被視為谷歌對競爭對手ChatGPT的直接回應(yīng),標(biāo)志著人工智能領(lǐng)域的新一輪競爭正式拉開帷幕。
Gemini 3 Pro的最大亮點在于其“原生多模態(tài)”特性,能夠同時處理文本、圖像和音頻,打破了傳統(tǒng)模型僅限于文本交互的局限。谷歌官方演示中,該模型不僅流暢地處理了RNA數(shù)據(jù),還展示了翻譯菜譜照片為食譜、根據(jù)視頻講座創(chuàng)建交互式學(xué)習(xí)卡片等實用功能。在Gemini應(yīng)用中,用戶還能利用內(nèi)置的Canvas構(gòu)建功能更全面的程序,支持“生成式界面”,創(chuàng)建包含圖片的雜志式視覺格式,或根據(jù)用戶提示定制動態(tài)布局的用戶界面。
搜索功能方面,Gemini 3 Pro同樣表現(xiàn)出色。它能夠根據(jù)用戶搜索呈現(xiàn)圖像、表格、網(wǎng)格和模擬等視覺元素,通過分解問題并理解用戶意圖,找到之前可能遺漏的新內(nèi)容。谷歌DeepMind高級總監(jiān)兼產(chǎn)品負(fù)責(zé)人Tulsee Doshi表示,這一模型將助力谷歌實現(xiàn)“人人皆可獲取且人人皆可使用”的信息目標(biāo),推動搜索引擎向更豐富、更完整的實際內(nèi)容展示邁進(jìn)。
在回應(yīng)風(fēng)格上,Gemini 3 Pro也進(jìn)行了顯著調(diào)整。谷歌強(qiáng)調(diào),該模型的回復(fù)將更加“智能、簡潔、直接”,摒棄陳詞濫調(diào)和奉承,提供真正的洞見。這一變化被視為對ChatGPT等模型空洞奉承式回應(yīng)的直接挑戰(zhàn),旨在為用戶提供更加實用和有價值的信息。
除了上述改進(jìn)外,Gemini 3 Pro還具備更強(qiáng)大的推理和智能代理能力,能夠完成更復(fù)雜的任務(wù)并可靠地進(jìn)行長期規(guī)劃。谷歌表示,該模型為Gemini Agent的實驗性功能提供支持,可在應(yīng)用內(nèi)幫助用戶執(zhí)行查看和整理電子郵件、搜索和預(yù)訂旅行等任務(wù)。
在性能方面,Gemini 3 Pro在官方21項基準(zhǔn)測試中表現(xiàn)優(yōu)異,除OCR和代理編碼外,其他指標(biāo)均遙遙領(lǐng)先。谷歌還特別強(qiáng)調(diào)了人類最終測試、終端工作臺2.0和SimpleQA Verified三個指標(biāo),矛頭直指Claude Sonnet4.5和GPT-5.1等競爭對手,試圖證明其在標(biāo)準(zhǔn)化知識生成、AI工具使用乃至“人工智能”整體指標(biāo)上的全方位優(yōu)勢。
與此同時,谷歌還推出了基于Gemini 3 Pro及其他第三方模型的開發(fā)工具Antigravity。這款工具支持多個智能體直接訪問編輯器、終端和瀏覽器,旨在面向“智能體優(yōu)先的未來”。Antigravity具有生成“工件”文件以驗證工作進(jìn)度、報告操作和外部工具使用情況等功能,并提供了編輯器視圖和管理器視圖兩種主要使用視圖,方便用戶同時控制多個代理。
谷歌表示,Antigravity中的代理能夠從過去的工作中學(xué)習(xí),保留特定代碼片段或執(zhí)行任務(wù)所需步驟。在官方演示中,該工具成功構(gòu)建并測試了一個基本的航班跟蹤應(yīng)用程序,并通過瀏覽器錄制報告了測試結(jié)果。目前,Antigravity已推出公開預(yù)覽版,兼容Windows、macOS和Linux系統(tǒng)。
谷歌此次的發(fā)布不僅限于一個大模型,更展示了其構(gòu)建從模型、應(yīng)用到開發(fā)者的完整生態(tài)閉環(huán)的野心。隨著多模態(tài)交互的普及,AI正從一位博學(xué)的“對話者”轉(zhuǎn)變?yōu)槟芸础⒛苈牎⒛苄袆印⒛芤?guī)劃的“執(zhí)行者”。這一轉(zhuǎn)變預(yù)示著未來3D和全景、沉浸式交互競賽的臨近,人工智能領(lǐng)域?qū)⒂瓉砀蛹ち业母偁幒透訌V闊的發(fā)展前景。











