滾動資訊

當(dāng)前位置：首頁 > 資訊 > 信息流 > 正文內(nèi)容

谷歌Gemini AI勇奪IMO金牌，自然語言解題展現(xiàn)實(shí)力

時(shí)間：2025-07-22 17:06:22 來源：ITBEAR編輯：快訊團(tuán)隊(duì) IP：北京 發(fā)表評論無障礙通道

谷歌DeepMind在國際數(shù)學(xué)奧林匹克競賽（IMO）中取得了歷史性的突破，其AI系統(tǒng)Gemini Deep Think成功解答了前五道題目，以35分的優(yōu)異成績榮獲金牌，距離滿分42分僅差7分。這一壯舉標(biāo)志著AI在解決復(fù)雜數(shù)學(xué)問題上的能力邁上了新的臺階。

DeepMind此次的勝利尤為引人注目，因?yàn)镚emini Deep Think是在嚴(yán)格的4.5小時(shí)時(shí)間限制內(nèi)完成所有題目的，與人類參賽者面對的挑戰(zhàn)完全一致。更令人稱奇的是，該AI系統(tǒng)完全依賴自然語言——英語，而無需任何形式化語言的輔助，這與此前AI在數(shù)學(xué)競賽中的表現(xiàn)形成了鮮明對比。

IMO自1959年創(chuàng)辦以來，一直是全球頂尖數(shù)學(xué)人才的競技場。每年，來自世界各地的優(yōu)秀學(xué)生匯聚一堂，在4.5小時(shí)內(nèi)解答六道涵蓋代數(shù)、幾何、組合數(shù)學(xué)和數(shù)論等領(lǐng)域的深度數(shù)學(xué)問題。只有表現(xiàn)最突出的8%選手才能獲得金牌，這一榮譽(yù)象征著數(shù)學(xué)領(lǐng)域的至高成就。

近年來，隨著AI技術(shù)的飛速發(fā)展，IMO逐漸成為檢驗(yàn)AI能力的試驗(yàn)場。數(shù)學(xué)問題不僅要求邏輯推理，還考驗(yàn)創(chuàng)造性思維和嚴(yán)謹(jǐn)性，這對AI系統(tǒng)提出了巨大挑戰(zhàn)。去年，AlphaProof和AlphaGeometry 2在解答六道題中的四道時(shí)展現(xiàn)出了強(qiáng)大的實(shí)力，獲得了銀牌，這標(biāo)志著AI開始接近頂尖人類的數(shù)學(xué)推理水平。

然而，Gemini Deep Think的表現(xiàn)更為出色。它不僅成功解答了五道題，而且解題過程得到了IMO組委會的官方認(rèn)證，這使其成為了首個(gè)獲得官方金牌級別認(rèn)可的AI系統(tǒng)。DeepMind的高級主任研究員Thang Luong領(lǐng)導(dǎo)的團(tuán)隊(duì)通過引入Deep Think的高級版本，結(jié)合并行思考技術(shù)，使模型能夠同時(shí)探索多種解題路徑，最終整合出最優(yōu)答案。

Gemini Deep Think的解題過程堪稱驚艷。以第一道解析幾何題為例，模型通過設(shè)定引理和證明定理，成功簡化了問題，并得出了唯一可能的陽光線數(shù)量為0、1或3條的結(jié)論。對于第二道平面幾何題，模型則將證明過程分為了五個(gè)清晰的步驟，最終證明了直線VH是圓Σ在點(diǎn)V處的切線。在解答第三道函數(shù)題時(shí)，模型確定了Bonza函數(shù)的性質(zhì)與分類，并完成了上界和下界的證明。數(shù)論題和組合博弈題同樣被Gemini Deep Think以嚴(yán)謹(jǐn)?shù)倪壿嫼颓逦牟襟E一一攻克。

DeepMind的這一成就不僅是對AI能力的巨大提升，也為數(shù)學(xué)界帶來了新的希望。通過訓(xùn)練Gemini學(xué)會更靈活、更直觀的推理，谷歌正逐步構(gòu)建出能夠解決更復(fù)雜、更前沿?cái)?shù)學(xué)問題的AI。這一突破不僅展示了AI在數(shù)學(xué)領(lǐng)域的潛力，也為未來AI與數(shù)學(xué)家、科學(xué)家等專業(yè)人士的合作奠定了堅(jiān)實(shí)的基礎(chǔ)。

然而，值得注意的是，OpenAI在DeepMind官宣之前曾搶先發(fā)布了自己的AI系統(tǒng)在IMO中的表現(xiàn)，并自稱獲得了金牌。然而，這一成績并未經(jīng)過IMO官方的獨(dú)立驗(yàn)證和評分，引發(fā)了不少爭議。相比之下，DeepMind的金牌成績得到了官方的正式認(rèn)證，更加令人信服。

OpenAI的研究員對DeepMind的成就表示了肯定，但同時(shí)也強(qiáng)調(diào)了自己在通用自然語言推理方面所取得的進(jìn)展。盡管雙方在方法上各有千秋，但DeepMind的官方認(rèn)證成績無疑為其在這場AI數(shù)學(xué)競賽中贏得了更多的掌聲和認(rèn)可。

舉報(bào) 0 收藏 0 打賞 0評論 0

更多>同類資訊

人形機(jī)器人：AGI的未來終端，將重塑社會生產(chǎn)力與生活方式

07-22

AI+可穿戴新風(fēng)口：前森合創(chuàng)新CTO丘力攜智能潛水鏡再出發(fā)

07-22

2025 AI/AR智能眼鏡光波導(dǎo)技術(shù)趨勢大會，匯聚行業(yè)精英共探未來

07-22

清華團(tuán)隊(duì)星動L7：55自由度機(jī)器人秀街舞疊衣，手速驚人

07-22

MiniMax搶跑IPO：黃仁勛合影風(fēng)波背后的上市急行軍

07-22

京東進(jìn)軍香港零售市場，大手筆收購佳寶超市控股權(quán)

07-22

番茄IP收稿暫停引熱議，平臺編劇透露：內(nèi)部決策所致

07-22

抖音助力酒店暑期大促，業(yè)界目光聚焦長期引流與會員增長

07-22

娃哈哈家族遺產(chǎn)風(fēng)波：農(nóng)夫山泉等競品能否借機(jī)突圍？

07-22

大廠人跳槽新寵：得物，高薪與發(fā)展空間雙輪驅(qū)動

07-22

淘寶閃購8月8日沖刺億單目標(biāo)，推出“1分錢自提”外賣新玩法

07-22

星巴克自習(xí)室引熱議，網(wǎng)友意見各異：有人點(diǎn)贊有人盼降價(jià)

07-22

閑魚：興趣消費(fèi)的樂園，年輕人的精神高地

07-22

娃哈哈遺產(chǎn)爭奪戰(zhàn)升級，宗馥莉以廣告暗含深意，局勢撲朔迷離

07-22

商業(yè)巨頭跨界自習(xí)室：星巴克、宜家、京東MALL打造學(xué)習(xí)新去處

07-22

點(diǎn)擊查看更多 +

全站最新

谷歌Gemini AI勇奪IMO金牌，自然語言解題展現(xiàn)實(shí)力

人形機(jī)器人：AGI的未來終端，將重塑社會生產(chǎn)力與生活方式

AI+可穿戴新風(fēng)口：前森合創(chuàng)新CTO丘力攜智能潛水鏡再出發(fā)

2025 AI/AR智能眼鏡光波導(dǎo)技術(shù)趨勢大會，匯聚行業(yè)精英共探未來

清華團(tuán)隊(duì)星動L7：55自由度機(jī)器人秀街舞疊衣，手速驚人

MiniMax搶跑IPO：黃仁勛合影風(fēng)波背后的上市急行軍

熱門內(nèi)容

本欄最新

MiniMax搶跑IPO：黃仁勛合影風(fēng)波背后的上市急行軍

京東進(jìn)軍香港零售市場，大手筆收購佳寶超市控股權(quán)

番茄IP收稿暫停引熱議，平臺編劇透露：內(nèi)部決策所致

抖音助力酒店暑期大促，業(yè)界目光聚焦長期引流與會員增長

娃哈哈家族遺產(chǎn)風(fēng)波：農(nóng)夫山泉等競品能否借機(jī)突圍？

大廠人跳槽新寵：得物，高薪與發(fā)展空間雙輪驅(qū)動

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

谷歌Gemini AI勇奪IMO金牌，自然語言解題展現(xiàn)實(shí)力

日本精品一区二区三区高清久久