近期,Epoch AI這一非營利性人工智能研究機構發布了一份引人深思的報告,揭示了AI企業在推理模型領域面臨的新挑戰。據該報告預測,推理模型性能的顯著提升可能在未來一年內逐漸放緩。
這份報告深入分析了公開數據和多種假設,指出計算資源的有限性以及研究成本的激增是當前AI領域面臨的主要問題。長久以來,AI行業依賴推理模型不斷刷新基準測試成績,但這種模式正遭遇前所未有的阻礙。
Epoch AI的分析師Josh You指出,推理模型的崛起得益于其在特定任務上的卓越表現。例如,OpenAI的o3模型在近期內顯著提升了數學與編程能力。然而,這些模型通過增加計算資源來提升性能,處理復雜任務時需要更多的計算量,導致耗時增加。
推理模型的訓練過程通常包括兩個階段:首先基于海量數據進行常規訓練,然后應用強化學習技術進行微調。強化學習為模型提供“反饋”,幫助其優化解決方案,從而推動AI的快速迭代。然而,這種方法也暴露出了潛在的瓶頸。
據報告,前沿AI實驗室如OpenAI正加大對強化學習的投入。在訓練o3模型時,OpenAI使用了約10倍于前代o1的計算資源,其中大部分用于強化學習階段。OpenAI的研究者Dan Roberts透露,未來計劃將進一步優先強化學習,并投入更多計算資源,甚至超過初始模型訓練時的水平。
盡管這種策略加速了模型的改進,但Epoch AI的分析也提醒我們,這種改進并非沒有邊界。計算資源的增加將不可避免地遇到物理和經濟上的限制。Josh You在報告中詳細闡述了性能增長的差異,指出標準AI模型訓練的性能每年翻倍,而強化學習的性能則在每3-5個月內增長十倍。這種快速增長的趨勢可能將在2026年左右與整體AI前沿進展趨于一致。
Josh You還強調,推理模型的規模化不僅面臨計算資源的問題,還包括高昂的研究成本。如果研究持續需要高投入,推理模型可能無法達到預期的規模,這將進一步制約AI行業的發展。