滾動資訊

當前位置：首頁 > 資訊 > 業(yè)界動態(tài) > 正文內(nèi)容

GPT-5.2強勢登場：能力大提升反超谷歌Gemini 3 Pro，北大數(shù)學人才成核心力量

時間：2025-12-13 06:51:09 來源：快訊編輯：快訊 IP：北京 發(fā)表評論無障礙通道

OpenAI近日發(fā)布GPT-5.2系列模型，在實用功能與專業(yè)領域表現(xiàn)上實現(xiàn)全面突破。這款新模型不僅延續(xù)了前代版本的技術優(yōu)勢，更在辦公效率、代碼開發(fā)、科學研究和復雜任務處理等場景中展現(xiàn)出顯著提升，引發(fā)行業(yè)廣泛關注。

在辦公場景中，GPT-5.2的"打工能力"得到專項強化。測試數(shù)據(jù)顯示，其Thinking版本在人力資源表格制作、PPT設計等任務中，效率較前代提升超過30%。面對航班延誤、轉(zhuǎn)機錯過等復雜行程問題，該模型能自動完成機票改簽、特殊座位安排及賠償申請等全流程操作。投行分析師實測表明，在構建企業(yè)財務模型任務中，其得分從59.1%躍升至68.4%，能精準處理三表聯(lián)動、杠桿收購等高級建模需求。

代碼開發(fā)領域迎來新紀錄。在涵蓋Python、Java、Typescript和Go的SWE-Bench Pro評測中，GPT-5.2 Thinking取得55.6%的得分，特別在前端開發(fā)及3D UI設計方面表現(xiàn)突出。早期測試者反饋，該模型能高效處理復雜交互界面，顯著減少開發(fā)周期。長文檔處理能力同樣突破性進展，在256k上下文長度的測試中，模型準確率接近100%，雖在8倍長度測試中性能有所下降，但通過簡潔回復模式仍可維持高效工作流。

科學輔助能力成為最大亮點。在研究生水平問答評測GPQA Diamond中，Pro版本以93.2%的準確率領先行業(yè)，F(xiàn)rontierMath數(shù)學評測解題率達40.3%。實際案例顯示，該模型已能參與統(tǒng)計學習理論的前沿研究，其提出的證明方案經(jīng)同行評審驗證有效。視覺理解方面，模型對科學圖表的分析錯誤率降低50%，配合Python工具在高分辨率圖形推理測試中得分86.3%。

工具調(diào)用能力測試中，GPT-5.2在電信客服場景取得98.7%的準確率，零售場景達82%，展現(xiàn)出強大的端到端問題解決能力。經(jīng)濟價值評估顯示，在GDPval測試覆蓋的44個職業(yè)領域中，模型完成人類需4-8小時任務的速度是專家的11倍，成本不足百分之一，且71%的任務成果達到專業(yè)水平。事實準確性方面，幻覺問題發(fā)生率從8.8%降至6.2%，但官方仍建議關鍵內(nèi)容需人工復核。

核心研發(fā)團隊呈現(xiàn)新特征。公開信息顯示，主導此次升級的科學家多為2024年后加入的新成員，包括北大數(shù)學系校友、斯坦福統(tǒng)計學博士Yu Bai，UC伯克利博士Yaodong Yu等數(shù)學專業(yè)背景人才。這種人才結構變化，或許解釋了模型在科學計算和復雜邏輯推理方面的顯著進步。目前用戶可通過ChatGPT的Plus、Pro等套餐體驗新功能，生成復雜內(nèi)容約需數(shù)分鐘處理時間。

此舉距上一代GPT-5.1發(fā)布不足一月，背后是谷歌Gemini 3引發(fā)的“紅色警報”競爭壓力——OpenAI此前緊急叫停廣告、資訊等側項目，將所有資源集中于主模型研發(fā)，最終以“職場效率革新”為核心，交出這款…

12-13

扎克伯格煲湯挖OpenAI人才碰壁，OpenAI憑獨特文化與技術戰(zhàn)略穩(wěn)住核心

更有意思的是，OpenAI首席研究官MarkChen壓根沒慫，直接“以彼之道還施彼身”，也給Meta看中的人才送湯，甚至計劃帶核心團隊去學烹飪，準備打一場“送飯持久戰(zhàn)”。兩年多前更絕，行業(yè)主流都覺得預訓練…

12-13

宇樹智元爭春晚贊助席位？智元否認，兩大機器人巨頭資本動作引關注

智元機器人率先開價6000萬元，而宇樹科技直接將報價拉升至1億元。宇樹方面暫無公開表態(tài)。今年11月15日，宇樹科技披露IPO輔導工作完成報告。公開資料顯示，宇樹科技是一家專注于消費級、行業(yè)級高性能四足機器人…

12-13

榮耀高管聯(lián)動AG一諾曝光，“榮耀WIN”真機亮相或深耕電競市場

根據(jù)IT之家 11 日的報道，數(shù)碼博主 @復讀機002 曾披露一張疑似京東商詳頁截圖，顯示原定發(fā)布的榮耀 GT2 已更名為榮耀 WIN系列，并打出了“超神性能雙旗艦”的口號。AG 一諾作為職業(yè)電競領域的頂…

12-13

小米回應“不讓賣小米”謠言涉事村支書道歉蹭流量應有底線

今天下午，該事件當事人馮玉寬在抖音賬號「小馮來助農(nóng)」發(fā)布了道歉視頻，說自己的視頻給小米公司造成了影響，浪費了社會資源，以后會規(guī)范網(wǎng)絡言行，向大家表示誠摯歉意。小米作為農(nóng)產(chǎn)品名稱當然可以用，但你模仿人家高管…

12-13

三星攜三折疊新機強勢登場，配置拉滿，與華為同價對決誰能勝出？

智能手機市場的軍備競賽從未停歇，而華為最強勁的對手之一三星，終于攜其首款量產(chǎn)三折疊屏手機三星 Galaxy Z TriFold，向著折疊屏的巔峰王座發(fā)起了強有力的挑戰(zhàn)，這是被視為三星“技術集大成者”的超級旗艦…

12-13

小米汽車“現(xiàn)車選購”新增準新車，雷軍回應：沿用同行叫法并非首創(chuàng)

IT之家12月12日消息，今早11點，小米汽車「現(xiàn)車選購」新增準新車上架開售，可在小米汽車App選購。對于“準新車”的說法，小米官方稱是曾因運輸?shù)仍虍a(chǎn)生維修項的原廠新車，并已完成官方修復及售前附加檢驗。此外…

12-13

殺入“兩田”老家，廣汽計劃明年夏季進軍日本市場

12-13

小米官方澄清“小米公司不讓賣小米”：是徹頭徹尾的歪曲與污蔑

12-13

馬斯克霸氣回懟Waymo：連對抗特斯拉的機會都沒有

12-13

中國首個太空計算實驗室落戶上海交大

12-13

禾賽科技將于CES 2026發(fā)布L3級別遠距激光雷達

12-13

“小米公司不讓賣小米”事件當事人道歉

12-13

北京市網(wǎng)信辦通報：“東北雨姐”“貓一杯”等轉(zhuǎn)世賬號被關閉

12-13

谷歌聯(lián)手 Xreal 發(fā)布 Project Aura，中國團隊成核心力量

12-13

點擊查看更多 +

全站最新

吉利全球全域安全中心亮相：創(chuàng)多項紀錄開放共享并發(fā)布白皮書

小米汽車“現(xiàn)車選購”新增準新車，雷軍回應：沿用同行叫法并非首創(chuàng)

小米汽車現(xiàn)車選購再添新選擇雷軍詳解準新車：運輸致?lián)p后經(jīng)官方修復檢驗

小米汽車上架準新車雷軍回應：官方修復質(zhì)檢嚴格產(chǎn)能提升促交付

廣發(fā)證券“出海”步履不停：三地聯(lián)動筑網(wǎng)絡，全球資產(chǎn)配置服務顯成效

時代浪潮中，穩(wěn)健前行：手握底牌，方能笑對風云變幻

熱門內(nèi)容

本欄最新

小米汽車“現(xiàn)車選購”新增準新車，雷軍回應：沿用同行叫法并非首創(chuàng)

小米汽車現(xiàn)車選購再添新選擇雷軍詳解準新車：運輸致?lián)p后經(jīng)官方修復檢驗

小米汽車上架準新車雷軍回應：官方修復質(zhì)檢嚴格產(chǎn)能提升促交付

廣發(fā)證券“出海”步履不停：三地聯(lián)動筑網(wǎng)絡，全球資產(chǎn)配置服務顯成效

時代浪潮中，穩(wěn)健前行：手握底牌，方能笑對風云變幻

寒潮來襲羽絨服市場亂象頻出：高校爆款與質(zhì)量隱患并存引關注

本網(wǎng)站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務。如本站內(nèi)容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

GPT-5.2強勢登場：能力大提升反超谷歌Gemini 3 Pro，北大數(shù)學人才成核心力量

日本精品一区二区三区高清久久