中國(guó)大模型領(lǐng)域迎來(lái)重要突破,月之暗面公司推出的Kimi K2 Thinking模型引發(fā)全球關(guān)注。這款擁有萬(wàn)億參數(shù)規(guī)模的開(kāi)源思考模型,采用384個(gè)專家混合架構(gòu),在多個(gè)基準(zhǔn)測(cè)試中刷新行業(yè)紀(jì)錄,標(biāo)志著中國(guó)企業(yè)在生成式AI領(lǐng)域邁入全球第一梯隊(duì)。
在Humanity’s Last Exam(HLE)測(cè)試中,K2 Thinking取得44.9%的優(yōu)異成績(jī),在BrowseComp智能體搜索任務(wù)中達(dá)到60.2%的準(zhǔn)確率,更在SWE-Bench Verified編碼測(cè)試中以71.3%的表現(xiàn)領(lǐng)先業(yè)界。這些數(shù)據(jù)背后,是該模型在推理深度、工具調(diào)用連貫性等核心指標(biāo)上的顯著提升。測(cè)試顯示,K2 Thinking能在無(wú)人工干預(yù)情況下連續(xù)執(zhí)行200-300次工具調(diào)用,在博士級(jí)數(shù)學(xué)難題求解中展現(xiàn)出驚人的結(jié)構(gòu)化推理能力。
技術(shù)團(tuán)隊(duì)在海外社區(qū)的深度交流中,首次披露了多項(xiàng)關(guān)鍵創(chuàng)新。針對(duì)大模型訓(xùn)練成本爭(zhēng)議,團(tuán)隊(duì)澄清460萬(wàn)美元傳聞并非官方數(shù)據(jù),強(qiáng)調(diào)預(yù)訓(xùn)練階段的探索性投入難以量化。在硬件選擇上,他們采用Infiniband互聯(lián)的H800 GPU集群,通過(guò)極致優(yōu)化實(shí)現(xiàn)算力效率最大化。特別值得關(guān)注的是,團(tuán)隊(duì)冒險(xiǎn)采用未經(jīng)驗(yàn)證的Muon優(yōu)化器,經(jīng)過(guò)嚴(yán)格的小規(guī)模驗(yàn)證流程后,最終在大型模型訓(xùn)練中取得突破。
該模型在長(zhǎng)鏈推理領(lǐng)域的技術(shù)突破尤為引人注目。通過(guò)端到端智能體強(qiáng)化學(xué)習(xí)訓(xùn)練方式,K2 Thinking實(shí)現(xiàn)了200-300步的連貫工具調(diào)用,配合INT4量化推理技術(shù),在保持頂尖性能的同時(shí)將生成速度提升近兩倍。這種技術(shù)組合使得模型在處理復(fù)雜學(xué)術(shù)問(wèn)題、多步驟軟件開(kāi)發(fā)等場(chǎng)景時(shí)表現(xiàn)出色,例如在代理式編碼任務(wù)中,能夠流暢融入軟件代理工作流,精準(zhǔn)執(zhí)行復(fù)雜開(kāi)發(fā)指令。
數(shù)據(jù)策略方面,團(tuán)隊(duì)采用"藝術(shù)與科學(xué)結(jié)合"的獨(dú)特方法。通過(guò)分析數(shù)據(jù)間的交互效應(yīng),結(jié)合實(shí)驗(yàn)驗(yàn)證構(gòu)建訓(xùn)練集,這種策略在模型的后訓(xùn)練風(fēng)味調(diào)校中發(fā)揮關(guān)鍵作用。針對(duì)用戶反饋的"過(guò)度安全"問(wèn)題,團(tuán)隊(duì)承認(rèn)這是行業(yè)共性挑戰(zhàn),正在探索在保障安全的前提下優(yōu)化審查機(jī)制,同時(shí)不排斥未來(lái)引入可靠的年齡驗(yàn)證系統(tǒng)后開(kāi)放NSFW內(nèi)容可能性。
在模型架構(gòu)創(chuàng)新上,團(tuán)隊(duì)透露正在研發(fā)的KDA(Kernel Attention Dual Architecture)新架構(gòu)有望應(yīng)用于下一代K3模型。這種雙注意力機(jī)制設(shè)計(jì)可能帶來(lái)更高效的參數(shù)利用率,同時(shí)團(tuán)隊(duì)考慮進(jìn)一步開(kāi)源安全對(duì)齊技術(shù)棧,但會(huì)建立防濫用機(jī)制。對(duì)于上下文窗口擴(kuò)展等用戶關(guān)切,團(tuán)隊(duì)表示1M窗口版本因成本因素暫未推出,但技術(shù)儲(chǔ)備已完成,將在未來(lái)版本中重新評(píng)估。
這款模型的推出恰逢全球大模型競(jìng)爭(zhēng)關(guān)鍵期。面對(duì)即將發(fā)布的Gemini 3和GPT-5.1等閉源模型,K2 Thinking的開(kāi)源策略形成差異化競(jìng)爭(zhēng)。行業(yè)觀察者指出,月之暗面通過(guò)這次發(fā)布證明,中國(guó)團(tuán)隊(duì)不僅能在參數(shù)規(guī)模上追趕國(guó)際領(lǐng)先水平,更在推理效能、工程優(yōu)化等核心領(lǐng)域形成獨(dú)特優(yōu)勢(shì)。這場(chǎng)技術(shù)突破正在重塑全球AI競(jìng)爭(zhēng)格局,推動(dòng)行業(yè)從參數(shù)競(jìng)賽轉(zhuǎn)向?qū)嵱媚芰Ρ绕础?/p>











