滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

谷歌重磅發布Gemini 3：推理能力躍升，多領域應用開啟智能新體驗

時間：2025-11-21 02:11:51 來源：快訊編輯：快訊 IP：北京 發表評論無障礙通道

谷歌公司近日宣布，其最新人工智能模型Gemini 3正式面向全球用戶開放體驗。這款模型在推理能力、多模態理解和復雜任務規劃方面實現重大突破，標志著AI技術進入全新發展階段。作為繼2.5 Pro之后的迭代產品，Gemini 3在多項核心基準測試中刷新紀錄，展現出超越前代的綜合性能。

在推理能力驗證方面，Gemini 3 Pro以1501分的Elo評分登頂LMArena排行榜，在"人類終極考試"中取得37.5%的未工具輔助得分率，GPQA Diamond測試準確率達91.9%。數學領域表現尤為突出，MathArena Apex測試以23.4%的得分率確立行業新標桿。多模態處理能力同樣亮眼，MMMU-Pro和Video-MMMU測試分別獲得81%和87.6%的成績，SimpleQA Verified基準測試以72.1%的準確率刷新事實核查紀錄。

深度思考模式（Deep Think mode）的引入成為技術亮點。該模式在"人類終極考試"中將得分率提升至41.0%，GPQA Diamond測試準確率達93.8%，ARC-AGI-2基準測試在啟用代碼執行后取得45.1%的突破性成績。這種跨越式提升使模型能夠處理更復雜的邏輯推理和開放域問題，為科研、編程等高階應用提供強大支持。

多模態整合能力實現質的飛躍。模型可同步處理文本、圖像、視頻、音頻和代碼五種數據類型，支持100萬令牌的上下文窗口。實際應用場景中，用戶可上傳學術論文、視頻教程或運動錄像，模型能自動生成交互式學習卡片、可視化圖表或訓練計劃。在烹飪領域，系統可識別多語言手寫菜譜并整理成數字化食譜；運動分析功能則能通過視頻識別技術短板，制定個性化訓練方案。

開發者生態迎來重大升級。Google AI Studio、Vertex AI和全新智能體開發平臺Antigravity同步開放Gemini 3接入。在WebDev Arena排行榜上，該模型以1487的Elo評分領跑零樣本生成領域，Terminal-Bench 2.0終端操作測試取得54.2%的成績，SWE-bench Verified編程智能體測試準確率達76.2%。第三方平臺方面，Cursor、GitHub、JetBrains等已完成集成，支持開發者構建更復雜的交互界面。

智能體規劃能力取得實質性進展。在Vending-Bench 2模擬自動售貨機業務測試中，Gemini 3成功管理全年運營周期，保持工具使用和決策一致性，實現顯著高于其他模型的回報率。實際應用場景包括郵件分類、旅行規劃等復雜流程，用戶可授權模型自主完成多步驟任務。Google AI Ultra訂閱用戶現已可通過Gemini Agent體驗智能體服務，該功能將逐步擴展至更多谷歌產品。

安全體系構建成為研發重點。Gemini 3通過谷歌前沿安全框架的全面評估，在抗提示注入、網絡攻擊防護等方面表現優異。模型諂媚性顯著降低，決策獨立性增強。研發團隊與英國人工智能安全研究所等機構展開合作，獲得Apollo、Vaultis等第三方安全機構認證，相關技術細節已公開在模型卡文檔中。

用戶開放計劃分階段實施：Gemini應用用戶、Search AI Mode訂閱者及AI Studio開發者可立即體驗基礎功能；企業用戶通過Vertex AI和Gemini Enterprise獲得完整服務；深度思考模式預計在未來幾周內向Ultra訂閱用戶開放。谷歌透露，Gemini 3系列后續模型正在研發中，將持續拓展AI應用邊界。

更多>同類資訊

成都人工智能數字貿易中心啟航打造“技術+貿易”融合新標桿

11月18日，成都人工智能數字貿易中心在成都國際商貿城正式啟動運營。項目建設運營方、成都成商未來人工智能公司董事長孫正川介紹，中心將為企業提供技術支撐、資源對接、人才培養等全鏈條服務，預計可降低企業數字轉型成…

11-21

Google重磅發布Gemini 3：多項基準測試登頂，AI能力全面躍升

到了 11 月中旬，又有敏銳的開發者在移動端 Canvas 功能中發現了端倪：盡管界面顯示仍是 Gemini 2.5Pro，但輸出質量已經發生了質的飛躍，特別是在 SVG（Scalable Vector …

11-21

馬斯克xAI再發力：Grok 4.1發布，情商智商雙提升，團隊或成“全華班”

馬斯克在近日最新訪談中回應，“作為邁向通用人工智能（AGI）的關鍵一步，Grok5預計擁有約6萬億參數，其訓練和優化需要巨大的計算能力，并將成為世界上最智能的人工智能。整體來看，本次Grok 4.1的發…

11-21

鄭緯民院士盛贊阿里千問APP：中國AI大模型實力彰顯，未來可期走向世界

“中國超算之父”、中國工程院院士鄭緯民接受媒體采訪表示，全球人工智能競爭已進入關鍵階段，大模型不僅是技術制高點，更是國家科技實力的重要體現。展望未來，鄭緯民院士寄語道：“期待有更多的中國AI團隊能沉下心來，…

11-21

FPGA與AI擦出火花安路科技技術沙龍展現FPGA在AI領域新前景

安路科技的專家還講了安路的型號器件在人體識別AI算法中的應用，這塊我曾經在一些人工智能公司聽到過，確實FPGA在人體識別和動態捕捉上起到了很大作用，這一次是從聚焦FPGA的角度重新認識到了重要性。在AEC沙龍…

11-21

數字技術賦能用電安全：智慧空開引領傳統電閘革新，覆蓋多領域

曾經默默守護電路數十年的傳統電閘，正在被新一代智能網絡空氣開關（智慧空開）所替代，這場換代浪潮正從家庭延伸到工業、商業等各個領域。千行百業：數字化重塑用電安全生態工業制造：在智能制造車間，智能電閘通過集成…

11-21

從SRE到架構師：2024年Linux運維與云計算進階成長全攻略

隨著人工智能、大數據、區塊鏈等技術的興起，架構師需要了解這些技術在系統架構中的應用場景和實現方式，為企業的數字化轉型提供技術支持。可以從技術深度和廣度兩個維度進行規劃，一方面不斷深入鉆研某一技術領域，成為該領…

11-21

Procyon基準測試：數智化浪潮下企業PC性能與成本優化新利器

具體來看，在硬件層面，企業需結合自身AI應用場景，選擇適配的硬件配置；在推理精度選擇上，這是AI應用中的重要權衡點，企業需依據業務需求與設備資源，確定合適的推理精度；此外，軟件優化對AI性能的影響同樣顯著，…

11-21

谷歌地圖引入Gemini模型：AI助力行前規劃、地標指引與充電樁智能預測

11-21

航天電器“離岸孵化”破局貴陽經開區產業集群共譜高質量發展新篇

11-20

AI與超算強強聯合：日本團隊成功構建千億恒星級銀河系模擬模型

11-20

嵐圖泰山登場，以東方美學與尖端科技重塑豪華SUV新標桿

11-20

英偉達Q3財報亮眼：黃仁勛駁AI泡沫論稱GPU售罄AI賦能客戶增效

11-20

英偉達第三財季業績創新高盤后股價應聲大漲市值逼近新高

11-20

快手AI戰略顯成效：可靈AI單季收入超3億全年目標直指1.4億美金

11-20

點擊查看更多 +

全站最新

第50萬輛小米汽車下線！雷軍：體系能力獲驗證，2025年交付將超40萬

小米汽車50萬臺整車下線創紀錄！雷軍豪氣贈6萬車模慶里程碑

小米汽車50萬輛整車下線雷軍：2025年交付將超40萬持續發力安全與科創

雷軍：小米汽車50萬輛下線抓安全促交付 2025年預計交付超40萬輛

小米汽車50萬輛整車下線：以AI與制造硬實力，開啟新能源產業新篇章

小米汽車迎里程碑：第50萬輛整車下線，交付量攀升且三季度盈利7億

熱門內容

本欄最新

不足7萬續航超400km，駕乘舒適智能化強，繽果S憑啥成純電小車優選？

程一笑詳解快手AI布局：從技術到應用構建生態，驅動業務與效率雙提升

金山云2025年Q3財報：營收24.78億同比增31%，經調整運營利潤扭虧為盈

英特爾酷睿Ultra 200H處理器升級AI能力：120GB顯存暢跑120B大參數MoE模型

康奈爾大學研究：馬斯克Grokipedia引仇恨陰謀論網站，來源可信度存疑

一汽豐田技術品牌煥新來襲！新榮放、全新卡羅拉、bZ3智享家12月將登場

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

谷歌重磅發布Gemini 3：推理能力躍升，多領域應用開啟智能新體驗

日本精品一区二区三区高清久久