一個名為Gauss的AI數學助手近日引發學界轟動——這款由Math公司開發的自動形式化智能體,僅用三周時間就完成了頂尖數學家陶哲軒團隊耗時18個月才取得階段性進展的數學難題。該成果直接挑戰了人類數學家在形式化驗證領域的傳統優勢,標志著AI開始深度介入數學基礎研究。
這場突破發生在數學形式化驗證領域。2024年1月,陶哲軒與普林斯頓大學教授Alex Kontorovich共同發起挑戰,試圖在Lean證明系統中完成強素數定理的形式化驗證。這項涉及數論與復分析交叉領域的任務,直到今年7月才由人類團隊完成部分關鍵環節。而Gauss的介入徹底改變了局面:它不僅補全了人類卡殼的復分析核心證明,更生成了包含1200余個定理定義的2.5萬行Lean代碼,規模相當于歷史最大形式化項目的二十分之一。
形式化驗證的本質是將自然語言描述的數學證明轉化為計算機可執行的嚴格邏輯。Math公司創始人Christian Szegedy解釋道:"這相當于為數學理論建立數字基因庫,每個符號和推導步驟都必須經得起機器的窮舉驗證。"作為2015年提出Batch Normalization(批次歸一化)技術的深度學習先驅,Szegedy團隊此次開發的三位一體(Trinity)基礎設施,成功支撐了數千個并發AI代理的協同運算,解決了TB級內存消耗的工程難題。
對比數據更顯震撼:Lean標準數學庫Mathlib耗時8年、由600余位數學家共建的200萬行代碼庫中,Gauss單次任務就貢獻了其八十分之一的內容量。Math團隊宣稱,隨著算法優化,未來12個月內形式化代碼產出量有望提升100-1000倍,這或將重塑數學研究的范式邊界。
這場變革已引發學界深層反思。陶哲軒在Mastodon平臺撰文指出,AI工具的介入正在改變項目目標的隱含結構。傳統數學形式化過程中,人類團隊在追求顯性目標(如完成特定證明)時,會自然實現培養社區、優化代碼庫結構等隱性價值。但AI的優化邏輯可能導致"古德哈特定律"效應——當算法為完成特定指標而工作時,可能犧牲那些對人類研究者至關重要的衍生價值。
目前Math公司尚未公布完整技術報告,但已披露的細節顯示,Gauss采用了獨特的分層驗證策略:首先通過符號計算解析定理結構,再利用強化學習優化證明路徑,最后通過分布式系統實現大規模并發驗證。這種設計使其在處理復分析這類需要創造性洞察的領域時,展現出超越簡單模式匹配的能力。
學術圈對此反應兩極。部分研究者擔憂AI會削弱數學研究的人文屬性,但更多人看到機遇——普林斯頓大學數學系已啟動試點項目,嘗試將Gauss生成的代碼反哺至人類教學體系。正如Szegedy所言:"我們不是在制造取代數學家的機器,而是在建造能拓展人類認知邊界的數字望遠鏡。"這場靜默的革命,或許正在改寫數學研究的進化樹。