月之暗面核心團隊近日在海外社交平臺Reddit舉辦了一場互動問答活動,針對其最新發布的Kimi K2 Thinking模型展開深入交流。聯合創始人兼CEO楊植麟帶領技術團隊直面海外開發者提出的多個尖銳問題,涉及模型訓練成本、性能優化方向及開源策略等核心議題。
針對網絡流傳的"K2模型訓練成本僅460萬美元"說法,楊植麟明確否認該數據真實性。他解釋稱訓練成本包含大量研究實驗投入,難以簡單量化。團隊正研發K2的視覺-語言版本,同時透露混合線性注意力架構Kimi Linear的核心模塊可能應用于下一代模型K3。當被問及K3發布時間時,楊植麟以幽默方式回應:"在Sam的萬億美元數據中心建成前"。
關于模型性能爭議,技術團隊給出詳細技術解析。針對推理時間較長的問題,楊植麟承認當前版本優先保障絕對性能,后續將通過獎勵機制優化token使用效率。對于HLE基準測試高分與實際體驗差異,他表示團隊正在提升模型通用能力,未來將改善長思維鏈與實際場景的適配度。算法負責人周昕宇補充說明,KDA混合架構在預訓練和強化學習階段均展現出顯著優勢,其對比完整MLA架構具有更高效率和更低成本。
在模型應用層面,聯合創始人吳育昕回應了關于"封禁"的擔憂。他指出開源策略有助于消除企業部署顧慮,雖然部分使用限制超出控制范圍,但技術透明化能建立長期信任。針對上下文窗口擴展需求,團隊承認256K長度對大型代碼庫存在局限,未來版本將考慮提升容量,不過此前嘗試百萬token窗口時面臨服務成本過高挑戰。
關于產品形態規劃,周昕宇明確否定了開發AI瀏覽器的可能性,強調應專注模型核心能力提升而非疊加外殼。楊植麟透露kimi.com將持續迭代新功能,同時已推出480億參數的Kimi-Linear小型模型滿足不同場景需求。針對API計費模式爭議,團隊解釋當前按請求次數收費更符合企業成本結構,但承諾將探索更優解決方案。
這場跨國技術對話引發海外開發者熱烈反響,提問覆蓋模型架構、訓練細節到商業策略等20余個維度。中國AI團隊展現的技術深度與開放態度,折射出全球開發者對中國創新實力的重新認知。多個技術細節的披露,也為國際AI社區提供了具有參考價值的實踐樣本。











