滾動(dòng)資訊

當(dāng)前位置：首頁 > 資訊 > 信息流 > 正文內(nèi)容

DeepMind奪得IMO官方「唯一」金牌，卻成為OpenAI大型社死現(xiàn)場(chǎng)

時(shí)間：2025-07-22 14:17:11 來源：機(jī)器之心Pro編輯：快訊團(tuán)隊(duì) IP：北京 發(fā)表評(píng)論無障礙通道

機(jī)器之心報(bào)道

機(jī)器之心編輯部

剛剛，谷歌 DeepMind 宣布，其新一代 Gemini 進(jìn)階版模型在 IMO 競(jìng)賽中正式達(dá)到金牌得主水平，成功解決了六道超高難度試題中的五道，拿下 35 分（滿分 42 分），成為首個(gè)獲得奧賽組委會(huì)官方認(rèn)定為金牌的AI系統(tǒng)。

更重要的是，該系統(tǒng)首次證明人工智能無需依賴專業(yè)編程語言，僅通過自然語言理解即可攻克復(fù)雜數(shù)學(xué)難題。

谷歌 DeepMind 首席執(zhí)行官哈薩比斯在社交媒體平臺(tái) X 上強(qiáng)調(diào)：這是官方結(jié)果！

谷歌這項(xiàng)成績(jī)遠(yuǎn)超其在 2024 年的表現(xiàn)。當(dāng)時(shí)，AlphaProof 和 AlphaGeometry 系統(tǒng)組合解決了六個(gè)問題中的四個(gè)，榮獲銀牌。

今年的突破來自 Gemini Deep Think，這是一個(gè)增強(qiáng)型推理系統(tǒng)，采用了研究人員所謂的并行思維。與遵循單一推理鏈的傳統(tǒng)人工智能模型不同，Deep Think 會(huì)同時(shí)探索多種可能的解決方案，最終得出答案。

哈薩比斯在后續(xù)帖子中解釋道：谷歌的模型以自然語言進(jìn)行端到端運(yùn)行，直接從官方問題描述中生成嚴(yán)格的數(shù)學(xué)證明。并強(qiáng)調(diào)，該系統(tǒng)在比賽標(biāo)準(zhǔn)的 4.5 小時(shí)時(shí)限內(nèi)完成了任務(wù)。

谷歌這次官宣，讓 OpenAI 處于尷尬的處境，畢竟 OpenAI 因繞過官方競(jìng)賽規(guī)則提前官宣，遭到很多人吐槽。可參考《OpenAI 拿 IMO 金牌是火了，但惹怒大批人：搶發(fā)炒作，搶學(xué)生風(fēng)頭》。

谷歌 DeepMind 這種謹(jǐn)慎的發(fā)布方式贏得了 AI 界的廣泛贊譽(yù)，尤其與競(jìng)爭(zhēng)對(duì)手 OpenAI 對(duì)類似成績(jī)的處理方式形成了鮮明對(duì)比。

「我們沒有在周五宣布這一消息，是因?yàn)槲覀冏鹬?IMO 理事會(huì)最初的要求，即所有人工智能實(shí)驗(yàn)室只有在官方結(jié)果經(jīng)過獨(dú)立專家驗(yàn)證，并且學(xué)生獲得應(yīng)有的贊譽(yù)后，才能分享其成果。」哈薩比斯寫道。

對(duì)比之下，大家都在譴責(zé) OpenAI 做事不地道、毫無風(fēng)度、無禮。反觀谷歌 DeepMind ，行事正直，符合人性。

這種批評(píng)源于 OpenAI 決定在不參與 IMO 官方評(píng)估流程的情況下公布自己的成績(jī)。OpenAI 讓一個(gè)由前 IMO 參賽選手組成的小組對(duì)其 AI 的表現(xiàn)進(jìn)行評(píng)分，社區(qū)中的一些人認(rèn)為這種做法缺乏可信度。

OpenAI 又來回應(yīng)了

OpenAI 研究科學(xué)家 Noam Brown 向谷歌發(fā)來祝賀，說是祝賀，更多的是為了回應(yīng)質(zhì)疑。以下是回應(yīng)內(nèi)容。

谷歌采用的方法與我們略有不同，這表明還有很多研究方向值得探討。

兩個(gè)月前，IMO 組委會(huì)曾通過郵件邀請(qǐng)我們參加基于 Lean 語言的正式比賽。由于我們一直致力于不受 Lean 限制的自然語言通用推理研究，因此婉拒了該邀請(qǐng)。組委會(huì)從未就自然語言解題形式與我們進(jìn)行過接洽。

在過去的幾個(gè)月里，我們?cè)谕ㄓ猛评矸矫嫒〉昧撕艽筮M(jìn)展。這包括收集、整理和訓(xùn)練高質(zhì)量的數(shù)學(xué)數(shù)據(jù)，這些數(shù)據(jù)也將用于未來的模型。在 IMO 評(píng)估中，我們沒有使用 RAG 或任何其他工具。

我們提交的每份證明都由三位外部 IMO 獎(jiǎng)牌獲得者評(píng)分，并獲得了一致的正確性認(rèn)可。我們還將證明公開發(fā)布，以便任何人都可以驗(yàn)證其正確性。

證明地址：https://github.com/aw31/openai-imo-2025-proofs/

在分享我們的結(jié)果之前，我們與 IMO 的一位董事會(huì)成員進(jìn)行了交談，他要求我們等到頒獎(jiǎng)典禮結(jié)束后再公開結(jié)果，我們的發(fā)布滿足要求。

我們?cè)陬C獎(jiǎng)典禮結(jié)束后，于太平洋時(shí)間～凌晨 1 點(diǎn)（澳大利亞東部標(biāo)準(zhǔn)時(shí)間下午 6 點(diǎn)）宣布。從來沒有人要求我們晚于此宣布。

最重要的是，我們很高興與世界分享我們的進(jìn)展和成果。AI 推理能力正在快速發(fā)展，這些 IMO 結(jié)果確實(shí)表明了這一點(diǎn)。

通過這件事，我們不難發(fā)現(xiàn)，這場(chǎng) AI 登上數(shù)學(xué)奧林匹克舞臺(tái)的較量，不只是一次技術(shù)競(jìng)賽，更是一場(chǎng)關(guān)于規(guī)范、節(jié)奏與合作精神的展示。DeepMind 選擇了等待官方認(rèn)可，再謹(jǐn)慎發(fā)布成績(jī)，贏得了金牌，也贏得了尊重。而 OpenAI 盡管也取得了不俗成果，卻因時(shí)機(jī)與方式的問題，引發(fā)了爭(zhēng)議。這背后提醒我們，在通往 AGI 的路上，除了技術(shù)力，如何與人類社會(huì)的規(guī)則與價(jià)值觀對(duì)齊，正變得愈發(fā)重要。

https://x.com/polynoamial/status/1947398536577822798

https://venturebeat.com/ai/google-deepmind-makes-ai-history-with-gold-medal-win-at-worlds-toughest-math-competition/

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

更多>同類資訊

工信部擬規(guī)范零公里二手車市場(chǎng)，新車禁轉(zhuǎn)二手說法為誤讀

07-22

小米電動(dòng)汽車YU7三分鐘售20萬輛，跨界成就超越蘋果

07-22

AI大模型實(shí)測(cè)：部分在負(fù)面誘導(dǎo)下輸出危險(xiǎn)方案，專家呼吁加強(qiáng)監(jiān)管

07-22

OpenAI新任應(yīng)用CEO菲吉·西莫：8月上任，致力AI技術(shù)全球普及

07-22

蘋果AI技術(shù)報(bào)告揭秘：端側(cè)內(nèi)存大減，云端引入PT-MoE新架構(gòu)

07-22

雷軍連續(xù)點(diǎn)贊特斯拉，小米SU7保值率奪冠展現(xiàn)實(shí)力

07-22

摩根大通：OpenAI未來四年將燒錢3000多億

07-22

產(chǎn)業(yè)鏈企業(yè)加速推進(jìn)項(xiàng)目建設(shè) 固態(tài)電池行業(yè)從0到1加速

07-22

馬斯克愿景落地：特斯拉超級(jí)充電站餐廳在好萊塢開業(yè)

07-22

俞敏洪、董宇輝，“分手”不后悔

07-22

雷軍隔天再夸特斯拉：保值率不錯(cuò)，但這次我們領(lǐng)先

07-22

聯(lián)想Legion Go 2掌機(jī)工程機(jī)遭偷跑：銳龍Z2處理器

07-22

Galaxy S23系列手機(jī)用戶反饋：升級(jí)后，拍照質(zhì)量下滑

07-22

三星Galaxy Z Fold7手機(jī)完成50萬次折疊認(rèn)證

07-22

余承東現(xiàn)身享界S9T試駕現(xiàn)場(chǎng)：展示智慧電門、尾門功能

07-22

點(diǎn)擊查看更多 +

全站最新

摩根大通：OpenAI未來四年將燒錢3000多億

產(chǎn)業(yè)鏈企業(yè)加速推進(jìn)項(xiàng)目建設(shè) 固態(tài)電池行業(yè)從0到1加速

馬斯克愿景落地：特斯拉超級(jí)充電站餐廳在好萊塢開業(yè)

俞敏洪、董宇輝，“分手”不后悔

雷軍隔天再夸特斯拉：保值率不錯(cuò)，但這次我們領(lǐng)先

聯(lián)想Legion Go 2掌機(jī)工程機(jī)遭偷跑：銳龍Z2處理器

熱門內(nèi)容

本欄最新

OpenAI新任應(yīng)用CEO菲吉·西莫：8月上任，致力AI技術(shù)全球普及

蘋果AI技術(shù)報(bào)告揭秘：端側(cè)內(nèi)存大減，云端引入PT-MoE新架構(gòu)

雷軍連續(xù)點(diǎn)贊特斯拉，小米SU7保值率奪冠展現(xiàn)實(shí)力

摩根大通：OpenAI未來四年將燒錢3000多億

產(chǎn)業(yè)鏈企業(yè)加速推進(jìn)項(xiàng)目建設(shè) 固態(tài)電池行業(yè)從0到1加速

馬斯克愿景落地：特斯拉超級(jí)充電站餐廳在好萊塢開業(yè)

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

DeepMind奪得IMO官方「唯一」金牌，卻成為OpenAI大型社死現(xiàn)場(chǎng)

日本精品一区二区三区高清久久