7月22日,在第66屆國際數學奧林匹克競賽(IMO)中,谷歌DeepMind的Gemini Deep Think模型正式參賽并獲得金牌,成績為35分,達到金牌標準。
該模型采用通用推理方法,直接處理自然語言問題,并在官方規定的4.5小時時限內完成解答。
相比之下,OpenAI未正式參賽,而是通過三位前IMO金牌得主獨立評分,宣稱其實驗性推理模型同樣解答了五道題目,達到金牌水平,但因未經過IMO委員會的正式驗證,引發爭議。
谷歌DeepMind自去年起與IMO官方密切合作,其結果由競賽委員會正式認證,而OpenAI的提前宣布違反了IMO競賽委員會的信息披露規則。
IMO是全球最負盛名的數學賽事之一,今年共有630名參賽者,僅有67人獲得金牌。谷歌計劃將Gemini Deep Think提供給數學家測試,并最終向其AI Ultra訂閱用戶開放,定價為每月250美元。OpenAI則表示短期內不會發布這一級別的數學能力模型。