在2025年國際大學程序設計競賽(ICPC)世界總決賽的獨立“AI實驗賽道”中,AI系統展現出驚人實力。這場匯聚全球103個國家、近3000所大學139支頂尖隊伍的賽事,首次將AI納入官方監督的競技場,人工智能與人類選手在完全相同的題目和評測標準下展開對決。
OpenAI派出的GPT-5與實驗性推理模型組合成為全場焦點。該系統在五小時內完美攻克全部12道題目,若計入人類排名將穩居榜首。其中前11道題由GPT-5獨立完成,11道題均實現首次提交即通過評測。面對最具挑戰性的問題G時,實驗性推理模型在GPT-5陷入困境后接力完成,經過9次提交最終破解難題。該團隊特別強調,參賽模型未經過任何ICPC專項訓練,完全依靠通用推理能力。
谷歌Gemini 2.5 Deep Think的表現同樣亮眼。盡管比賽開始10分鐘后才啟動系統,仍在五小時內解決10道題目,達到金牌水準。前45分鐘內攻克8題,三小時內再解2題,按總用時計算可位列人類隊伍第二。對于人類選手集體折戟的問題C,Gemini通過動態規劃算法與嵌套三元搜索的組合方案成功破解。該模型假設每個儲存庫具有優先級值,利用極小化極大定理在凸解空間中快速定位最優解,展現出強大的多步推理能力。
在問題C的較量中,AI與人類形成鮮明對比。這道需要設計管道網絡分配液體的題目,要求找到使所有儲存庫最快填滿的配置方案。由于管道狀態存在無限可能組合,搜索最優解的難度極高。最終僅圣彼得堡國立大學團隊在3次嘗試中成功解題,而多數隊伍甚至未能提交解決方案。Gemini團隊公開的解題思路顯示,其解決方案融合了預訓練、后訓練、新型強化學習等多項技術突破。
值得關注的是,OpenAI參賽團隊中多位核心成員具有ICPC參賽背景。接任Ilya的首席科學家Jakub Pachocki便是典型代表,這位前競賽選手的加入為模型優化提供了獨特視角。與一年前推出的o1模型相比,當前推理系統在智能水平、運算速度和成本效益方面均有顯著提升,標志著AI在復雜問題處理領域邁出關鍵一步。
谷歌DeepMind透露,Gemini的訓練過程融合了多步推理與并行思維技術。通過強化學習讓模型針對編程領域難題進行推理和代碼生成,并從結果反饋中持續優化。這種訓練方式使系統能夠處理現實世界中更具復雜性的工程問題,為AI應用開辟了新路徑。
當被問及未來競賽計劃時,OpenAI研究副總裁Jerry Tworek的回應引發行業遐想。他表示ICPC可能成為AI參與競技的最后一項賽事,轉而將研究重心投向更具現實意義的領域。從其最新個人介紹中可見,如何將科學工程技能應用于現實問題解決,已成為這家頂尖實驗室的核心探索方向。