在近期舉辦的AI創造者嘉年華上,硅星人創始人兼CEO駱軼航與月之暗面(Kimi)技術副總裁付強展開了一場深度對話,圍繞K2模型研發過程中的“反常識”決策以及Kimi探索通用人工智能(AGI)的技術路徑展開探討。
針對K2模型采用DeepSeekV3架構引發的討論,付強回應稱技術選擇基于現實考量。他指出,采用成熟架構可復用現有推理資源,降低開發成本。盡管整體架構相似,但K2在超參數配置、專家模型數量等細節上存在顯著差異。通過優化密集層模型緊湊度,最終實現的模型性能與原始架構形成本質區別。
當被問及為何在行業轉向后訓練時重啟預訓練路線,付強坦言這是戰略選擇。他以學生學習為例,強調模型需要像人類一樣具備舉一反三的能力。通過提升Token使用效率,而非單純擴大參數規模或增加訓練次數,Kimi團隊在有限的高質量語料中挖掘更深層次的信息關聯。這種技術路線導致產品迭代周期延長,但為模型智能化突破創造了可能。
關于開源戰略的決策邏輯,付強表示這源于技術生態建設的需要。通過開源基礎模型,開發者社區的反饋成為技術演進的重要驅動力。他特別強調要保持“半步領先”的節奏,既要吸收社區創新,又要確保核心技術自主性。這種開放策略與某些企業通過工程化手段包裝模型性能的做法形成鮮明對比。
面對Agent技術發展的爭議,付強用賽車運動作類比。第三方Agent開發者如同職業車手,能通過API調用充分發揮模型性能,但模型供應商必須深度參與應用場景構建。他指出當前多Agent調度方案本質上是工程化MoE架構,真正的智能突破需要模型原生具備工具調用和環境交互能力。
在AGI實現路徑的討論中,付強強調代碼生成能力的特殊價值。相較于情感交互等主觀評價領域,編程任務的客觀可驗證性使其成為衡量模型智能的理想標尺。K2模型在IDE集成和調用量上的優異表現,印證了通過解決高復雜度問題提升智能水平的技術路線有效性。
對于模型價值觀的探討,付強回歸人工智能發展的本質命題。他引用《苦澀的教訓》理論,主張賦予模型自主探索和試錯能力。就像人類通過實驗認知世界,模型也需要具備物理操作、化學實驗等環境交互能力,這種與人類共同進化的模式才是通往AGI的正途。











