滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

AI高考大考：DeepSeek、訊飛星火領跑，數學能力誰更強？

時間：2025-06-08 18:06:30 來源：ITBEAR編輯：快訊團隊 IP：北京 發表評論無障礙通道

在2025年高考數學科目考試結束后，網絡上關于試卷難度的討論熱度不減。作為科技領域的觀察者，我們不禁好奇，對于當前備受矚目的AI技術而言，這份數學試卷是否同樣具有挑戰性？為了回答這個問題，我們組織了一場特別的“考試”，邀請了多家知名的大模型參與，模擬完成了一套高考數學試卷。

本次“考試”中，我們挑選了以下幾家具有代表性的大模型作為“考生”：DeepSeek R1 0528、通義千問 Qwen3-235B-A22B、訊飛星火 X1-0420、豆包 Seed-Thinking-v1.5、文心 X1 Turbo、騰訊混元 Hunyuan T1 latest和GPT o3。由于網絡流傳的試題版本不一，我們通過多版本交叉驗證和教師解題驗證的方式，確保評測的準確性，試卷總分為150分。

我們特別邀請了一位擁有十年高中數學教研經驗的專家汪鵬老師，對大模型的答案進行評分。考慮到部分模型在OCR識別方面的限制，我們采用了OCR轉寫后輸入答題的方式進行處理。

接下來，讓我們通過幾道典型題目，看看這些大模型的表現如何。

首先是選擇題第一題，各家大模型均給出了正確答案，顯示出它們在基礎題目上的穩定表現。

選擇題第五題是一道涉及函數的題目，所有大模型再次全部答對，進一步證明了它們在復雜題目上的解題能力。

然而，在選擇題第八題中，豆包大模型和DeepSeek出現了錯誤，而其他模型均給出了正確答案。這道題目涉及對數函數，顯示出部分模型在處理特定數學知識點時的局限性。

在解答題方面，我們以第16題為例，這是一道涉及數列和函數的題目。DeepSeek、通義千問、訊飛星火和豆包大模型均給出了正確的解題過程和答案，而文心X1和騰訊混元則出現了不同程度的錯誤。

最后，我們來看難度更高的第18題。訊飛星火、豆包大模型、DeepSeek、通義千問和GPT o3均獲得了滿分，而文心X1則因答案錯誤而失分。

經過綜合評分，DeepSeek以143分的成績位列榜首，訊飛星火以141分緊隨其后，GPT o3以138分獲得第三名。這次“考試”不僅展示了AI在數學領域的強大能力，也暴露了部分模型在實際應用中的短板。

DeepSeek作為最新版本的大模型，在思考推理和數學能力方面表現出色，但OCR識別效果不佳，且推理速度慢、資源消耗高。訊飛星火則憑借其較小的模型量級和高效的數學能力，在評測中取得了優異成績，顯示出其在教育領域的深厚積累。

豆包和通義千問等大模型也表現出色，與國際頂尖模型水平相當。這次“考試”不僅是對AI數學能力的一次檢驗，更是對未來AI在教育領域深度應用的一次探索。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

玲瓏輪胎品牌價值破千億，AI引領智造、體驗與營銷全面革新！

06-20

中國移動榮耀強強聯手，共筑AI終端生態新未來！

中國移動將以此次合作為全新的起點，與榮耀及產業伙伴攜手共進，以創新為引擎，以生態為紐帶，共同開拓AI終端新藍海，重塑智慧數字生活新范式，為產業發展注入新動能，為用戶創造無限可能。發布會上，中國移動和榮耀發布…

06-20

中國移動榮耀強強聯手，共繪AI終端生態新藍圖！

中國移動將以此次合作為全新的起點，與榮耀及產業伙伴攜手共進，以創新為引擎，以生態為紐帶，共同開拓AI終端新藍海，重塑智慧數字生活新范式，為產業發展注入新動能，為用戶創造無限可能。發布會上，中國移動和榮耀發布…

06-20

中國移動榮耀強強聯手，共筑AI終端生態新未來

06-20

MWC上海盛況：智能體成AI新風口，科技巨頭加速布局未來交互體驗

榮耀AI產品專家張沖認為，AI從大模型技術走向應用，智能體是連接物理世界和數字世界的最佳橋梁。科創板上市公司佰維存儲也參展了MWC2025，其存儲產品已經在AI手機、AI PC以及AI教育、具身智能等領域…

06-20

2025數智平臺技術前瞻：大數據與AI如何重塑企業核心競爭力？

企業在數智平臺的實踐中形成了“數上生智”和“智外接數”兩種路徑，“數上生智”以數據平臺為核心，通過AI賦能提升智能能力，需解決多模態數據存儲管理等六大技術難點；“智外接數”以AI智能平臺為核心，增加數據能力…

06-20

MiniMax Hailuo02升級來襲：視頻AI性能飆升，性價比遠超谷歌Veo3？

06-20

大摩“人形機器人100”新動向：游戲與網安企業成新寵？

財聯社6月20日訊（編輯史正丞）摩根士丹利在近期更新的“人形機器人100”（Humanoid100）股票清單中，將游戲開發商和網絡安全企業加入了名單。在最新的調整中，由大摩分析師Adam Jonas領…

06-20

科大訊飛研究院2026校招啟航，你準備好加入了嗎？

來源| 科大訊飛招聘責編| 張雋茂上海大學就業服務網 https://zbb.shu.edu.cn 幫小編【…

06-20

榮耀攜手中國移動，開啟AI終端生態建設新篇章！

此次合作是繼雙方智能體互聯互通合作之后的又一次戰略升級，標志著全球網絡規模與客戶規模最大的移動通信運營商與全球領先的AI終端生態公司將依托各自核心優勢，圍繞AI終端的產品創新、生態共建與商業模式落地展開深入合…

06-20

榮耀Magic V5：AI智能體手機新標桿，折疊形態下的生產力革命？

其搭載的端側大模型與個人知識庫將實現個性化智能服務，多智能體調用、跨品牌互聯等AI技術應用，將進一步拓展折疊屏AI生態串聯打通能力。讓我們拭目以待，榮耀Magic V5帶來更輕薄的設計與折疊形態下更強大的產品…

06-20

榮耀Magic V5：AI智能體手機新標桿，折疊形態下的生產力革命？

06-20

兆芯攜手麒麟軟件，共筑“芯魂”開啟全棧創新合作新篇章

06-20

中國移動×榮耀：攜手開啟AI終端戰略合作新紀元！

中國移動將以此次合作為全新的起點，與榮耀及產業伙伴攜手共進，以創新為引擎，以生態為紐帶，共同開拓AI終端新藍海，重塑智慧數字生活新范式，為產業發展注入新動能，為用戶創造無限可能。發布會上，中國移動和榮耀發…

06-19

中國移動&榮耀強強聯手，AI終端戰略合作開啟新篇章！

06-19

點擊查看更多 +

全站最新

百度蘿卜快跑東涌擴測，自動駕駛技術香港加速前行！

Tata Technologies攜手Volvo Cars，共繪電氣化智能出行新藍圖

小米汽車加速布局：北京三廠落地，武漢上海新廠規劃曝光

比亞迪海外銷量飆升，歐洲成新引擎引領全球汽車市場變革

吉利銀河A7首秀：2L油耗續航2100km，電混家轎新時代已來？

眾泰汽車“0造車”連虧六年，高管薪酬卻逆勢大漲六成？

熱門內容

本欄最新

玲瓏輪胎品牌價值破千億，AI引領智造、體驗與營銷全面革新！

中國移動榮耀強強聯手，共筑AI終端生態新未來！

中國移動榮耀強強聯手，共繪AI終端生態新藍圖！

中國移動榮耀強強聯手，共筑AI終端生態新未來

MWC上海盛況：智能體成AI新風口，科技巨頭加速布局未來交互體驗

2025數智平臺技術前瞻：大數據與AI如何重塑企業核心競爭力？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

AI高考大考：DeepSeek、訊飛星火領跑，數學能力誰更強？

日本精品一区二区三区高清久久