在中文世界里,高考無疑是最具權威性和認可度的標準化考試之一,其公平性和嚴謹性在全球范圍內都享有盛譽。每年,數百萬學子懷揣夢想走進考場,通過這場考試邁向人生的新階段。
高考不僅是一場知識的較量,更是對學生抽象邏輯、信息整合、快速運算和寫作表達等多方面能力的全面檢驗。邏輯思考和推理能力,作為學生在校期間重點培養的素養,不僅是績優生的驕傲,更是他們未來步入社會的核心競爭力。然而,在AI大模型深度思考能力日益成熟的今天,不少學霸或許正面臨著前所未有的挑戰。
高考,這塊檢驗學生能力的試金石,如今也成為了衡量AI大模型解題能力的重要標尺。在高考期間,哪家大模型的解題能力更強,能否達到甚至超越人類的平均水平,成為了公眾熱議的話題。然而,當有人試圖用市面上主流的大模型來解答高考題時,卻意外發現,這些大模型似乎對高考并不感興趣。
在高考期間,當有人嘗試上傳高考全國卷I的數學試題時,部分大模型要么顯示無法上傳,要么表示無法識別。即便是往年的高考數學題,也遭遇了同樣的“禁言”。這一現象并非個例,主流國產模型廠商對今年高考數學題的回應普遍較為冷淡。
事實上,國產大模型不僅對數學難題采取了回避態度,還屏蔽掉了K12階段各學科內容的部分推理與解析能力。具體包括圖片識題(拍題)功能的禁用、高考真題關鍵詞的屏蔽,甚至禁止回答具體某年的高考題目。這一舉措在國產大模型發展進程中尚屬首次。
盡管ChatGPT、Claude等國外大模型能夠解答今年高考相關題目,并以高水平完成推理過程,但國產通用大模型在多項技術指標上已持續逼近全球頂級水平,甚至在某些垂直細分場景呈現領先趨勢。因此,它們完全具備解答高考題目的能力。然而,這一次功能的“降級”,顯然是一次策略性的行為,旨在體現平臺的技術治理與內容安全機制。
為了防止高考作弊,各大模型廠商紛紛采取了限制措施。當識別到題干結構類似高考題時,模型會直接返回“不支持”或“無法識別”。在圖片上傳識別時,系統會禁用OCR模塊或限制調用次數。同時,對“高考”、“高考真題”等關鍵詞進行自動限流。這是大模型內容風險識別系統在發揮作用。
盡管目前沒有公開報道顯示國內已有利用AI大模型在考場作弊的案例,但確實存在與大模型相關的考試虛假信息和詐騙行為,這已經引起了監管部門的重點關注。今年高考前,教育部、中央網信辦、公安部聯合查處了部分商家利用AI技術進行虛假宣傳、誘導考生購買所謂“高考押題卷”等行為。
高考作為我國最重要的考試之一,已被納入國家治理的重要領域。其標準性和普適性使得高考一直被看作是教育公平與社會穩定的制度性支柱。高考題目及其解析涉及國家教育考試制度,具有高度敏感性和保密等級。任何失誤或越界都可能被定性為破壞考試秩序。
監管層在今年已經明令禁止AI技術干擾正常的高考秩序,重點整治炒作夸大涉考不實信息、借AI技術生成發布涉考虛假信息以及干擾輿論和誤導公眾等行為。在考試期間,涉及高考試題相關行為可能被認定為協助作弊或擾亂考試秩序,平臺將面臨監管和法律風險。
從技術角度來看,模型廠商限制相關功能也并非全然是被迫的行為。AI大模型的幻覺問題始終難以解決,同一提問和提示詞下多次生成的內容也不完全一致。尤其是在數理等更標準化的科目中,這更容易將模型能力的弱項暴露給公眾。因此,為避免“AI答案”與“官方答案”不一致的尷尬,部分廠商選擇禁止作答高考題。
然而,大模型的平臺自律與避險機制在高考結束后將陸續恢復對K12內容的部分支持。因為市場需求始終存在,尤其是在大學期末考試季期間,“高考期間能用的AI”在社交平臺上引起了大學生群體的廣泛關注。他們紛紛調侃自己成為了“高考最大的受害者”,因為大模型在學習和成長中的輔助作用已經不可或缺。
盡管大模型在高等教育中的使用場景更為豐富,但也面臨著最為激烈的爭議。一些學校明令禁止使用,但也有學校和教師鼓勵學生以負責任的方式用AI輔助學習與研究。然而,在考試場景中,尤其是K12階段,大模型一旦越界,必然會對公平性構成實質破壞。