近期,AI領域迎來了一波新的熱潮,這一切皆源于月之暗面(Moonshot AI)所開源的萬億參數MoE模型——Kimi K2。7月11日,這款參數高達1T、激活參數32B的模型橫空出世,迅速吸引了全球開發者的目光。
Kimi K2并非只有規模上的震撼,其獨特之處在于對編程和智能體類任務的卓越表現。據Kimi公布的測評結果顯示,Kimi K2在自主編程、工具調用和數學推理三個維度上,均超越了同為開源模型的DeepSeek-V3和阿里Qwen3。這一成績無疑為Kimi K2贏得了業界的廣泛認可。
開源后的Kimi K2,其下載量在Hugging Face平臺上迅速攀升,一周內便突破了10萬次。同時,在大型語言模型權威競技場LMSYS中,K2-Instruct也取得了顯著成績,位列總榜第四,僅次于GPT-4o、Claude-3.5和Gemini-1.5-Pro。馬斯克在推特上轉發的OpenRouter趨勢數據顯示,K2在一周內便攀升至全球趨勢榜第二,僅次于Grok 4。
與以往不同,月之暗面此次開源并未選擇大規模營銷,而是采取了更為低調的方式。Kimi的算法工程師和研究員在推特、小紅書、知乎等社交平臺上積極分享K2的工作和技術,回復用戶疑問。這種真誠的互動引發了更多開發者的關注和贊譽,其中就包括Hugging Face聯合創始人Thomas Wolf,他對Kimi K2大加贊賞,認為開源模型正在挑戰最新的閉源權重模型。
Kimi的這次開源熱潮,與其過去半年的低調形成了鮮明對比。在過去兩年中,Kimi經歷了過山車般的起伏。雖然幾乎是最后一個推出ChatBot助手,但憑借著長文本和出色的策劃,Kimi一炮而紅,成為了最先出圈的大模型應用產品。然而,隨著DeepSeek等強勁對手的出現,Kimi也面臨了巨大的挑戰。
為了應對這些挑戰,Kimi選擇了蟄伏,并專注于模型的提升。To C的Kimi應用停止了投流,轉而主攻模型研發。同時,其他C端應用以及多模態上的嘗試也被迅速暫停。這一系列舉措雖然引發了質疑,但也為Kimi的翻身仗奠定了基礎。K2的發布,正是Kimi回歸AGI主線的一次有力宣言。
K2的發布不僅引起了全球開發者社區的震動,還被譽為“另一個DeepSeek時刻”。《Nature》雜志的發文更是對K2給予了高度評價。K2之所以如此重要,是因為它不僅主打高性能、低成本,而且真正做到了開源。更重要的是,K2在智能體類任務上展現出了強悍的性能。
Kimi的算法工程師Justin Wong在博客中提到,Kimi希望將人與AI的交互方式從chat-first轉變為artifact-first,即交付一個具體的成果物,而非一段聊天上下文。這種轉變使得K2在自主使用工具、完成任務的能力上得到了顯著提升。因此,在K2的使用案例中,我們可以看到它迅速生成3D旋轉地球模型、PPT、晝夜循環的山川峽谷3D景觀等成果。
K2還將模型的訓練和使用成本降低到了一個新的水平,同時保持著接近Claude主流模型的性能。這使得K2在性價比上具有了極大的優勢。Kimi K2 API的定價相較于同樣主打編程的Claude 4 Sonnet的API價格,整體成本可以下降超過75%。這一優勢吸引了大量開發者,使得K2在發布后迅速登上了OpenRouter的趨勢榜周第二。
盡管K2目前還存在一些不足,如Token輸出較為啰嗦、代碼質量與頂尖Claude相比仍有差距等,但其高性價比已經足以讓許多開發者為之傾倒。許多博主的測試案例中顯示,普通程序員使用K2進行一天的開發工作,所需費用僅幾塊錢,這大大降低了AI編程的算力使用門檻。
K2的成功也得益于Kimi在技術創新上的冒險。Kimi從訓練階段引入了新的優化器Muon,取代了原來主流的AdamW優化器。這一創新使得Muon在不同Llama架構模型上的算力需求只有AdamW的52%。這一冒險不僅成功了,還使得K2在發布時備受尊重。
如今,面對DeepSeek等強勁對手以及大廠在AI領域的全面布局,大模型初創公司的路似乎只有一條:開源并攻克最難的問題。Kimi的選擇無疑為其他初創公司提供了借鑒。K2的爆火已經為Kimi帶來了實實在在的回報:全球開發者開始關注這個充滿朋克文化的團隊,并對其未來發展充滿期待。