滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 人工智能 > 正文內(nèi)容

月之暗面Kimi K2 Thinking登場(chǎng)：大模型賽道從規(guī)模比拼轉(zhuǎn)向效能突圍

時(shí)間：2025-11-12 01:05:26 來(lái)源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評(píng)論無(wú)障礙通道

中國(guó)大模型領(lǐng)域迎來(lái)重要突破，月之暗面公司推出的Kimi K2 Thinking模型引發(fā)全球關(guān)注。這款擁有萬(wàn)億參數(shù)規(guī)模的開(kāi)源思考模型，采用384個(gè)專家混合架構(gòu)，在多個(gè)基準(zhǔn)測(cè)試中刷新行業(yè)紀(jì)錄，標(biāo)志著中國(guó)企業(yè)在生成式AI領(lǐng)域邁入全球第一梯隊(duì)。

在Humanity’s Last Exam（HLE）測(cè)試中，K2 Thinking取得44.9%的優(yōu)異成績(jī)，在BrowseComp智能體搜索任務(wù)中達(dá)到60.2%的準(zhǔn)確率，更在SWE-Bench Verified編碼測(cè)試中以71.3%的表現(xiàn)領(lǐng)先業(yè)界。這些數(shù)據(jù)背后，是該模型在推理深度、工具調(diào)用連貫性等核心指標(biāo)上的顯著提升。測(cè)試顯示，K2 Thinking能在無(wú)人工干預(yù)情況下連續(xù)執(zhí)行200-300次工具調(diào)用，在博士級(jí)數(shù)學(xué)難題求解中展現(xiàn)出驚人的結(jié)構(gòu)化推理能力。

技術(shù)團(tuán)隊(duì)在海外社區(qū)的深度交流中，首次披露了多項(xiàng)關(guān)鍵創(chuàng)新。針對(duì)大模型訓(xùn)練成本爭(zhēng)議，團(tuán)隊(duì)澄清460萬(wàn)美元傳聞并非官方數(shù)據(jù)，強(qiáng)調(diào)預(yù)訓(xùn)練階段的探索性投入難以量化。在硬件選擇上，他們采用Infiniband互聯(lián)的H800 GPU集群，通過(guò)極致優(yōu)化實(shí)現(xiàn)算力效率最大化。特別值得關(guān)注的是，團(tuán)隊(duì)冒險(xiǎn)采用未經(jīng)驗(yàn)證的Muon優(yōu)化器，經(jīng)過(guò)嚴(yán)格的小規(guī)模驗(yàn)證流程后，最終在大型模型訓(xùn)練中取得突破。

該模型在長(zhǎng)鏈推理領(lǐng)域的技術(shù)突破尤為引人注目。通過(guò)端到端智能體強(qiáng)化學(xué)習(xí)訓(xùn)練方式，K2 Thinking實(shí)現(xiàn)了200-300步的連貫工具調(diào)用，配合INT4量化推理技術(shù)，在保持頂尖性能的同時(shí)將生成速度提升近兩倍。這種技術(shù)組合使得模型在處理復(fù)雜學(xué)術(shù)問(wèn)題、多步驟軟件開(kāi)發(fā)等場(chǎng)景時(shí)表現(xiàn)出色，例如在代理式編碼任務(wù)中，能夠流暢融入軟件代理工作流，精準(zhǔn)執(zhí)行復(fù)雜開(kāi)發(fā)指令。

數(shù)據(jù)策略方面，團(tuán)隊(duì)采用"藝術(shù)與科學(xué)結(jié)合"的獨(dú)特方法。通過(guò)分析數(shù)據(jù)間的交互效應(yīng)，結(jié)合實(shí)驗(yàn)驗(yàn)證構(gòu)建訓(xùn)練集，這種策略在模型的后訓(xùn)練風(fēng)味調(diào)校中發(fā)揮關(guān)鍵作用。針對(duì)用戶反饋的"過(guò)度安全"問(wèn)題，團(tuán)隊(duì)承認(rèn)這是行業(yè)共性挑戰(zhàn)，正在探索在保障安全的前提下優(yōu)化審查機(jī)制，同時(shí)不排斥未來(lái)引入可靠的年齡驗(yàn)證系統(tǒng)后開(kāi)放NSFW內(nèi)容可能性。

在模型架構(gòu)創(chuàng)新上，團(tuán)隊(duì)透露正在研發(fā)的KDA（Kernel Attention Dual Architecture）新架構(gòu)有望應(yīng)用于下一代K3模型。這種雙注意力機(jī)制設(shè)計(jì)可能帶來(lái)更高效的參數(shù)利用率，同時(shí)團(tuán)隊(duì)考慮進(jìn)一步開(kāi)源安全對(duì)齊技術(shù)棧，但會(huì)建立防濫用機(jī)制。對(duì)于上下文窗口擴(kuò)展等用戶關(guān)切，團(tuán)隊(duì)表示1M窗口版本因成本因素暫未推出，但技術(shù)儲(chǔ)備已完成，將在未來(lái)版本中重新評(píng)估。

這款模型的推出恰逢全球大模型競(jìng)爭(zhēng)關(guān)鍵期。面對(duì)即將發(fā)布的Gemini 3和GPT-5.1等閉源模型，K2 Thinking的開(kāi)源策略形成差異化競(jìng)爭(zhēng)。行業(yè)觀察者指出，月之暗面通過(guò)這次發(fā)布證明，中國(guó)團(tuán)隊(duì)不僅能在參數(shù)規(guī)模上追趕國(guó)際領(lǐng)先水平，更在推理效能、工程優(yōu)化等核心領(lǐng)域形成獨(dú)特優(yōu)勢(shì)。這場(chǎng)技術(shù)突破正在重塑全球AI競(jìng)爭(zhēng)格局，推動(dòng)行業(yè)從參數(shù)競(jìng)賽轉(zhuǎn)向?qū)嵱媚芰Ρ绕础?/p>

11-12

2025 Ceva技術(shù)研討會(huì)聚焦端側(cè)AI，共探智能邊緣時(shí)代產(chǎn)業(yè)新機(jī)遇

11-12

Ceva首席戰(zhàn)略官：智能邊緣加速推進(jìn)，物理AI引領(lǐng)產(chǎn)業(yè)變革新未來(lái)

11-12

華為第六屆“十大發(fā)明”成果公布，多項(xiàng)創(chuàng)新技術(shù)引領(lǐng)行業(yè)新發(fā)展

11-12

軟銀清倉(cāng)英偉達(dá)套現(xiàn)58億美元，孫正義加碼人工智能布局

11-12

特斯拉加速布局：得州超級(jí)工廠擴(kuò)建，Optimus人形機(jī)器人年產(chǎn)目標(biāo)1000萬(wàn)臺(tái)

11-12

2025烏鎮(zhèn)峰會(huì)圓滿落幕：國(guó)際化升級(jí)，多項(xiàng)成果與活動(dòng)創(chuàng)歷屆新高

11-12

《2025互聯(lián)網(wǎng)藍(lán)皮書(shū)》發(fā)布：我國(guó)6G領(lǐng)跑，5G、AI等多領(lǐng)域發(fā)展成果斐然

11-12

阿里巴巴與萬(wàn)豪國(guó)際攜手，共拓中國(guó)AI合作新篇，探索多元合作領(lǐng)域

11-11

軟銀與OpenAI修訂協(xié)議：2025年第二輪融資全額追加225億美元投資

11-11

軟銀第二季度凈利潤(rùn)達(dá)2.50萬(wàn)億日元，出售英偉達(dá)全部股份套現(xiàn)58億美元

11-11

存力中國(guó)行北京站聚焦：AI推理存算協(xié)同創(chuàng)新破局行業(yè)難題

11-11

上緯新材攜手智元進(jìn)軍機(jī)器人領(lǐng)域，“智元上緯”公眾號(hào)已上線并發(fā)布預(yù)熱海報(bào)

11-11

當(dāng)科技邂逅時(shí)尚：Rokid樂(lè)奇AI眼鏡開(kāi)啟智能穿戴新潮流

11-11

賽力斯港股上市啟新程借雙平臺(tái)之力助推問(wèn)界全球版圖擴(kuò)張

11-11

點(diǎn)擊查看更多 +

全站最新

2025首批智利車?yán)遄拥顷懫炊喽?高效運(yùn)輸加補(bǔ)貼讓品質(zhì)車?yán)遄痈臁帮w”入百姓家

小米汽車“挖孔機(jī)蓋”專利獲批，技術(shù)創(chuàng)新驅(qū)動(dòng)汽車外觀設(shè)計(jì)新趨勢(shì)

小米汽車10月成績(jī)亮眼：零售銷量近5萬(wàn)，YU7批發(fā)超3.3萬(wàn)超越特斯拉Model Y

小米汽車10月零售4.8萬(wàn)+ YU7四月交付破7萬(wàn) 科技賦能打造新能源市場(chǎng)新勢(shì)力

小米汽車10月銷量亮眼，YU7車型崛起，新能源市場(chǎng)本土品牌顯實(shí)力

三千萬(wàn)輛整車落地，一汽-大眾以品質(zhì)與溫情書(shū)寫(xiě)三千萬(wàn)幸福篇章

熱門(mén)內(nèi)容

本欄最新

東風(fēng)奕派兩周年獻(xiàn)禮，eπ007+攜四大優(yōu)勢(shì)登場(chǎng)，助力新能源賽道加速跑

東風(fēng)奕派兩周年獻(xiàn)禮：eπ007+攜四大優(yōu)勢(shì)登場(chǎng)，為年輕人出行注入新動(dòng)力

東風(fēng)奕派eπ007+高能登場(chǎng)，以“奕派速度”為年輕人解鎖百萬(wàn)級(jí)出行新體驗(yàn)

嵐圖泰山來(lái)襲：外觀大氣內(nèi)飾豪華能否在高端SUV市場(chǎng)分一杯羹？

13.99萬(wàn)起！東風(fēng)奕派eπ007+攜百萬(wàn)級(jí)體驗(yàn)入場(chǎng)，重塑14萬(wàn)級(jí)轎跑新格局

東風(fēng)奕派eπ007+上市，14萬(wàn)級(jí)配激光雷達(dá)四驅(qū)，打造年輕專屬轎跑

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

月之暗面Kimi K2 Thinking登場(chǎng)：大模型賽道從規(guī)模比拼轉(zhuǎn)向效能突圍

日本精品一区二区三区高清久久