日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

DeepMind奪得IMO官方「唯一」金牌,卻成為OpenAI大型社死現(xiàn)場(chǎng)

   時(shí)間:2025-07-22 14:17:11 來源:機(jī)器之心Pro編輯:快訊團(tuán)隊(duì) IP:北京 發(fā)表評(píng)論無障礙通道
 

機(jī)器之心報(bào)道

機(jī)器之心編輯部

剛剛,谷歌 DeepMind 宣布,其新一代 Gemini 進(jìn)階版模型在 IMO 競(jìng)賽中正式達(dá)到金牌得主水平,成功解決了六道超高難度試題中的五道,拿下 35 分(滿分 42 分),成為首個(gè)獲得奧賽組委會(huì)官方認(rèn)定為金牌的AI系統(tǒng)。

更重要的是,該系統(tǒng)首次證明人工智能無需依賴專業(yè)編程語言,僅通過自然語言理解即可攻克復(fù)雜數(shù)學(xué)難題。

谷歌 DeepMind 首席執(zhí)行官哈薩比斯在社交媒體平臺(tái) X 上強(qiáng)調(diào):這是官方結(jié)果!

谷歌這項(xiàng)成績(jī)遠(yuǎn)超其在 2024 年的表現(xiàn)。當(dāng)時(shí),AlphaProof 和 AlphaGeometry 系統(tǒng)組合解決了六個(gè)問題中的四個(gè),榮獲銀牌。

今年的突破來自 Gemini Deep Think,這是一個(gè)增強(qiáng)型推理系統(tǒng),采用了研究人員所謂的并行思維。與遵循單一推理鏈的傳統(tǒng)人工智能模型不同,Deep Think 會(huì)同時(shí)探索多種可能的解決方案,最終得出答案。

哈薩比斯在后續(xù)帖子中解釋道:谷歌的模型以自然語言進(jìn)行端到端運(yùn)行,直接從官方問題描述中生成嚴(yán)格的數(shù)學(xué)證明。并強(qiáng)調(diào),該系統(tǒng)在比賽標(biāo)準(zhǔn)的 4.5 小時(shí)時(shí)限內(nèi)完成了任務(wù)。

谷歌這次官宣,讓 OpenAI 處于尷尬的處境,畢竟 OpenAI 因繞過官方競(jìng)賽規(guī)則提前官宣,遭到很多人吐槽。可參考《OpenAI 拿 IMO 金牌是火了,但惹怒大批人:搶發(fā)炒作,搶學(xué)生風(fēng)頭》。

谷歌 DeepMind 這種謹(jǐn)慎的發(fā)布方式贏得了 AI 界的廣泛贊譽(yù),尤其與競(jìng)爭(zhēng)對(duì)手 OpenAI 對(duì)類似成績(jī)的處理方式形成了鮮明對(duì)比。

「我們沒有在周五宣布這一消息,是因?yàn)槲覀冏鹬?IMO 理事會(huì)最初的要求,即所有人工智能實(shí)驗(yàn)室只有在官方結(jié)果經(jīng)過獨(dú)立專家驗(yàn)證,并且學(xué)生獲得應(yīng)有的贊譽(yù)后,才能分享其成果。」哈薩比斯寫道。

對(duì)比之下,大家都在譴責(zé) OpenAI 做事不地道、毫無風(fēng)度、無禮。反觀谷歌 DeepMind ,行事正直,符合人性。

這種批評(píng)源于 OpenAI 決定在不參與 IMO 官方評(píng)估流程的情況下公布自己的成績(jī)。OpenAI 讓一個(gè)由前 IMO 參賽選手組成的小組對(duì)其 AI 的表現(xiàn)進(jìn)行評(píng)分,社區(qū)中的一些人認(rèn)為這種做法缺乏可信度。

OpenAI 又來回應(yīng)了

OpenAI 研究科學(xué)家 Noam Brown 向谷歌發(fā)來祝賀,說是祝賀,更多的是為了回應(yīng)質(zhì)疑。以下是回應(yīng)內(nèi)容。

谷歌采用的方法與我們略有不同,這表明還有很多研究方向值得探討。

兩個(gè)月前,IMO 組委會(huì)曾通過郵件邀請(qǐng)我們參加基于 Lean 語言的正式比賽。由于我們一直致力于不受 Lean 限制的自然語言通用推理研究,因此婉拒了該邀請(qǐng)。組委會(huì)從未就自然語言解題形式與我們進(jìn)行過接洽。

在過去的幾個(gè)月里,我們?cè)谕ㄓ猛评矸矫嫒〉昧撕艽筮M(jìn)展。這包括收集、整理和訓(xùn)練高質(zhì)量的數(shù)學(xué)數(shù)據(jù),這些數(shù)據(jù)也將用于未來的模型。在 IMO 評(píng)估中,我們沒有使用 RAG 或任何其他工具。

我們提交的每份證明都由三位外部 IMO 獎(jiǎng)牌獲得者評(píng)分,并獲得了一致的正確性認(rèn)可。我們還將證明公開發(fā)布,以便任何人都可以驗(yàn)證其正確性。

證明地址:https://github.com/aw31/openai-imo-2025-proofs/

在分享我們的結(jié)果之前,我們與 IMO 的一位董事會(huì)成員進(jìn)行了交談,他要求我們等到頒獎(jiǎng)典禮結(jié)束后再公開結(jié)果,我們的發(fā)布滿足要求。

我們?cè)陬C獎(jiǎng)典禮結(jié)束后,于太平洋時(shí)間~凌晨 1 點(diǎn)(澳大利亞東部標(biāo)準(zhǔn)時(shí)間下午 6 點(diǎn))宣布。從來沒有人要求我們晚于此宣布。

最重要的是,我們很高興與世界分享我們的進(jìn)展和成果。AI 推理能力正在快速發(fā)展,這些 IMO 結(jié)果確實(shí)表明了這一點(diǎn)。

通過這件事,我們不難發(fā)現(xiàn),這場(chǎng) AI 登上數(shù)學(xué)奧林匹克舞臺(tái)的較量,不只是一次技術(shù)競(jìng)賽,更是一場(chǎng)關(guān)于規(guī)范、節(jié)奏與合作精神的展示。DeepMind 選擇了等待官方認(rèn)可,再謹(jǐn)慎發(fā)布成績(jī),贏得了金牌,也贏得了尊重。而 OpenAI 盡管也取得了不俗成果,卻因時(shí)機(jī)與方式的問題,引發(fā)了爭(zhēng)議。這背后提醒我們,在通往 AGI 的路上,除了技術(shù)力,如何與人類社會(huì)的規(guī)則與價(jià)值觀對(duì)齊,正變得愈發(fā)重要。

https://x.com/polynoamial/status/1947398536577822798

https://venturebeat.com/ai/google-deepmind-makes-ai-history-with-gold-medal-win-at-worlds-toughest-math-competition/

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  爭(zhēng)議稿件處理  |  English Version
 
主站蜘蛛池模板: 新巴尔虎右旗| 建水县| 漯河市| 屯留县| 汝阳县| 石景山区| 万州区| 三穗县| 衡东县| 绥宁县| 西丰县| 渭源县| 密山市| 江源县| 南投县| 益阳市| 西吉县| 嘉兴市| 日照市| 沈丘县| 鹤岗市| 藁城市| 沂南县| 新野县| 怀柔区| 分宜县| 奉化市| 武城县| 巫山县| 定襄县| 桂平市| 宁津县| 涟水县| 黄陵县| 望江县| 中方县| 江安县| 夏津县| 观塘区| 万荣县| 祁门县|