滾動資訊

當前位置：首頁 > 資訊 > 信息流 > 正文內容

剛剛，OpenAI神秘新模型斬獲IMO 2025金牌！攻克奧數巔峰，硅谷沸騰

時間：2025-07-19 20:25:53 來源：新智元編輯：快訊團隊 IP：北京 發表評論無障礙通道

新智元報道

編輯：編輯部

OpenAI的神秘通用推理模型，竟然攻克IMO 2025的5道難題，成功摘金了？這個消息，讓Greg Brockman等一眾大佬激動轉發。也就是說，OpenAI很可能已經研發出顛覆性的推理技術，徹底告別CoT。還有一個炸裂消息：GPT-5也要來了。

就在昨天，

然而，就在剛剛，OpenAI 投下了一枚重磅炸彈——他們用一款全新的「通用推理模型」，成功奪下了IMO 2025的金牌！

6道題，解出5道，狂攬35分！

要知道，此前表現最好的Gemini 2.5 Pro，也只得了13分。

聯創Greg Brockman、負責人Alexander Wei，以及OpenAI的各路研究員，紛紛在推上激動宣布了這一里程碑式的成就！

對此，德撲之父Noam Brown表示，這個成績的意義甚至超越了「AI攻克IMO」本身。

左右滑動查看

消息一出，整個硅谷為之沸騰！

人們紛紛猜測，OpenAI這次很可能祭出了一種顛覆性的推理技術，徹底告別了傳統的CoT思維鏈。

這，不僅僅是一個模型的勝利，更是一個全新時代的開端！

更令人震驚的是，OpenAI宣布，這個創造了歷史的模型，并非傳聞中的GPT-5，而是一個全新的、實驗性的模型！

而這個模型完全不會被發布，簡直太神秘了！

神秘模型，拿下IMO金牌

Alexander Wei和他的團隊，讓模型在與人類完全相同的條件下進行比賽：

兩個4.5小時的考試時段，沒有工具，沒有網絡，僅憑對題目的理解，用自然語言寫下完整的證明過程。

然后，由三位前IMO獎牌得主嚴格評分。

最終，模型以35/42的驚人高分，達到了金牌的水平。

相比之下，無論是在圍棋、Dota還是其他復雜任務，過去的AI想要獲得勝利，往往都要在特定領域進行專門的訓練。

但這一次，OpenAI打破了這條鐵律——新模型不僅不是IMO「特供」，而且還能進行長達數小時的思考。

相比之下，我們熟知的o1模型是以秒計算，Deep Research也不過是以分鐘計算。

這種深度的、持久的創造性思維能力，正是以往AI難以逾越的天塹！

這意味著什么？是否達到了AGI水平？拿下IMO有何特殊？

首先，與以往的基準相比，IMO問題需要更高水平的持續創造性思維。

在推理時間范圍方面，現在已經一路攀升：GSM8K（頂級人類約需0.1分鐘）→MATH基準（約1分鐘）→AIME（約10分鐘）→IMO（約100分鐘）。

其次，IMO的提交內容是難以驗證的多頁證明。

在此領域取得進展需要超越具有明確、可驗證獎勵的強化學習范式。

通過這樣做，OpenAI研究團隊獲得了一個能夠在人類數學家層面構建復雜且無懈可擊論點的模型。

此外該模型并非通過在「特定任務（IMO）」訓練達到這一能力水平，而是在通用強化學習和測試時計算擴展方面實現了新的突破。

所以，昨晚被曝光的o3-alpha，難道只是前戲？

原來，這才是OpenAI真正憋著的大招！

完整解題過程

如果你有興趣，可以看看OpenAI新鮮放出的2025年IMO賽題解答。

模型解出了第一題到第五題（P1-P5），但沒能解出第六題（P6）。果然如傳聞所說，這次的第六題難度極高，全球僅有6人破解。

倉庫地址：https://github.com/aw31/openai-imo-2025-proofs/blob/main/README.md

下面我們來看看，這個新模型對于前五道題的具體解題過程。

第一題，是一道解析幾何題。

可以看出，解答這道題的關鍵點，就是要找出覆蓋點的n條線，以及陽光線的可能數量。

模型采用了獨特的方法，確定了所有滿足條件的非負整數k。

引理：當n≥4時，任何覆蓋P_n的n條直線必須使用三角形的一條邊。

對n=3的情況進行精確分析。

對于一般的n≥3，證明對于每個n存在k=0、1、3的配置。

利用歸約引理完成主要結論的證明。

第二道題，是一道平面幾何題。

示意圖如下。

大神網友放出的解答中，想要直接證明過點H且平行于AP的直線與三角形BER的外接圓相切，是很困難的。

不過，這個問題可以換成另一種表述：定義X為不包含B的一側的EF的中點，如果能夠證明HX與EF平行，基本上就可以證明這個結論了。

另一方面，如果這條線的切線，那么它必須在中點處接觸圓。

因此，只要證明這兩點就足夠了。

而模型在證明過程中，主要完成了以下四步：

解析設定和參數。設P為三角形ACD的外心。連接AP與兩個圓Ω、Γ的交點分別為點E、F。求過點B、E、F的外接圓方程。

第三道題，是一道函數題。

在人類選手的解法中，這道題的關鍵是證明下圖中黃色的不等式。

模型對于這道題的解法，分為以下四步。

考慮bonza類型的函數，即滿足性質P_f的函數。

當函數在某個素數處取值大于1時，考慮模素數意義下的同余關系。

推論：如果某個奇素數p滿足f>1，那么整個函數f必須是恒等函數。

進入主要的結構性引理：分析在非恒等函數的情況下，函數的結構。

第四道題，是一道數論問題。

它的解題關鍵步驟可以化為如下形式。

模型在解答過程中，也采用了類似思路。

第五道題，考察的是博弈論。

這道題的解法，包含以下三部分。

模型在解題過程中，則是討論了以下三種情況。

當 λ ≥ c（無防御）時，Alice總是獲勝。

當 λ > c 時，Alice獲勝。

當 λ < c（c = 1/√2）時，Bazza獲勝。

第六道題，涉及到了圖形的組合數學。

這道公認的難題，人類參賽者也只有6人可以做出，o3、o4-mini、Gemini 2.5 Pro、Grok-4、DeepSeek-R1六個大模型也全員零分，即使是OpenAI的這個超強模型，也同樣折戟了。

目前看來，世界上還不存在能解出第六題的大模型。

一個彩蛋

Alexander Wei宣布這個消息時，使用了「草莓」的形象。

「Strawberry」是OpenAI當初在內部研發時使用的代號，用于推動一項全新的推理模型項目，就是我們現在熟悉的「o」系列模型。

作者介紹

Alex Wei是OpenAI的研究科學家，主要研究方向為大語言模型和推理。之前也曾研究過機器學習、博弈論和算法的交叉領域。

他在加州大學伯克利分校獲得計算機科學博士學位，師從Nika Haghtalab、Michael I. Jordan和Jacob Steinhardt；在哈佛大學獲得學士學位和碩士學位，師從 Jelani Nelson 和 Scott Kominers。

他曾是FAIR團隊的一員，參與構建了首個在《外交》（Diplomacy）游戲中達到人類水平的人工智能——CICERO。該成果在2022年發表于《科學》雜志。

參考資料：

https://x.com/alexwei_/status/1946477742855532918

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

鄭欽文發文：昨天完成手術

07-19

聯發科新一代神U預定：曝天璣8500年底登場

07-19

108萬輛！成都新能源汽車保有量“領跑”非汽車限購城市｜四川經濟熱觀察

07-19

MagicLink 推出“全球最快多卡同時讀取”讀卡器，119 美元

07-19

蔚來李斌：2025年7月將達成第8000萬次換電服務，充換電站已超8000座

07-19

理想汽車面臨挑戰：問界與小米如何動搖其市場地位

07-19

K2引爆全球熱潮，Kimi借DeepSeek之勢崛起

07-19

名創優品鐵達信M17充電寶3C標識為多邊形

07-19

華為原“Petal 地圖”正式更新為“花瓣地圖”

07-19

零跑D系列旗艦SUV新車及跨界車B05諜照曝光

07-19

ChatGPT Agent：OpenAI新力作，開啟人機協作生產力新篇章

如果說完成復雜任務是ChatGPT Agent的“硬實力”，那么其高度協作的交互模式則是它的“軟實力”，也是它與其他AI工具顯著區別。這些數字背后，反映出一個清晰的信號：ChatGPT Agent在通用推…

07-19

華為開發者大會啟幕：共探鴻蒙智聯與AI創新，點亮數字未來之路

這場匯聚全球開發者智慧的年度科技盛會，以 "鴻蒙智聯，AI 賦能"為主題，在為期三天的議程中設置百余場技術論壇，為超過萬名與會者搭建起探索數字邊界的創新平臺。當阿維塔展區的無人駕駛原型車在數字沙盤上完成復…

07-19

黃仁勛雷軍北京密會：英偉達小米背后，科技巨頭中國市場新布局？

你能想象到，作為全球知名的英偉達CEO，黃仁勛一踏上中國的土地，就直接見了雷軍，而這場會面背后，似乎有更深層的意義。從表面上看，黃仁勛來中國可能只是一次普通的商務訪問，尤其是和雷軍這樣的行業大佬會面。如今，…

07-19

京東智谷六周年：聚焦本土化戰略，深莞智造新高地加速崛起

知名企業戰略咨詢顧問劉潤以破解“出海風險”——本土化戰略的灣區實踐為切入點，與現場500多位企業家一道，共商企業加速轉型升級、實現創新發展的策略。京東智谷執行總裁魏強介紹，6年來，京東智谷扎根區域產業前沿地…

07-19

國產C909首航武漢至延安，云端紅色課堂傳承延安精神

07-19

點擊查看更多 +

全站最新

名創優品鐵達信M17充電寶3C標識為多邊形

華為原“Petal 地圖”正式更新為“花瓣地圖”

零跑D系列旗艦SUV新車及跨界車B05諜照曝光

ChatGPT Agent：OpenAI新力作，開啟人機協作生產力新篇章

華為開發者大會啟幕：共探鴻蒙智聯與AI創新，點亮數字未來之路

黃仁勛雷軍北京密會：英偉達小米背后，科技巨頭中國市場新布局？

熱門內容

本欄最新

K2引爆全球熱潮，Kimi借DeepSeek之勢崛起

名創優品鐵達信M17充電寶3C標識為多邊形

華為原“Petal 地圖”正式更新為“花瓣地圖”

零跑D系列旗艦SUV新車及跨界車B05諜照曝光

ChatGPT Agent：OpenAI新力作，開啟人機協作生產力新篇章

華為開發者大會啟幕：共探鴻蒙智聯與AI創新，點亮數字未來之路

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

剛剛，OpenAI神秘新模型斬獲IMO 2025金牌！攻克奧數巔峰，硅谷沸騰

日本精品一区二区三区高清久久