日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

線性注意力復(fù)興潮起:Kimi新模型突破,MiniMax折返引行業(yè)新思考

   時(shí)間:2025-11-02 04:48:47 來(lái)源:互聯(lián)網(wǎng)編輯:快訊 IP:北京 發(fā)表評(píng)論無(wú)障礙通道
 

在大語(yǔ)言模型(LLM)領(lǐng)域,一場(chǎng)關(guān)于注意力機(jī)制的技術(shù)路線之爭(zhēng)正悄然展開。隨著國(guó)產(chǎn)模型在工程實(shí)踐中的持續(xù)推進(jìn),線性注意力機(jī)制這一曾被邊緣化的技術(shù),正重新回到行業(yè)視野。其核心驅(qū)動(dòng)力,既源于國(guó)內(nèi)算力資源的有限性,也與智能體(Agent)技術(shù)落地的長(zhǎng)遠(yuǎn)目標(biāo)密切相關(guān)。面對(duì)國(guó)外主流模型閉源、技術(shù)細(xì)節(jié)難以窺探的現(xiàn)狀,國(guó)內(nèi)團(tuán)隊(duì)正通過(guò)創(chuàng)新探索,試圖打破傳統(tǒng)注意力機(jī)制的瓶頸。

線性注意力的研究并非新事。早在2020年前后,學(xué)術(shù)界便涌現(xiàn)出大量相關(guān)論文,試圖將注意力機(jī)制的時(shí)間與內(nèi)存復(fù)雜度從O(n2)降至O(n),以提升長(zhǎng)序列處理效率。然而,早期嘗試普遍面臨精度損失的問(wèn)題,導(dǎo)致其始終未能被應(yīng)用于任何開源的、達(dá)到業(yè)界頂尖水平的大語(yǔ)言模型中。這一技術(shù)路線因此長(zhǎng)期被視為“效率優(yōu)先、精度妥協(xié)”的權(quán)宜之計(jì)。

轉(zhuǎn)折點(diǎn)出現(xiàn)在今年下半年。國(guó)產(chǎn)模型團(tuán)隊(duì)率先掀起線性注意力的復(fù)興浪潮。6月,MiniMax團(tuán)隊(duì)推出擁有4560億總參數(shù)、460億激活參數(shù)的MoE模型M1,首次采用“閃電注意力”(lightning attention)機(jī)制;8月,Qwen3團(tuán)隊(duì)發(fā)布的Qwen3-Next模型,同樣引入線性注意力變體;9月,DeepSeek團(tuán)隊(duì)發(fā)布的V3.2模型,則通過(guò)稀疏注意力(sparse attention)實(shí)現(xiàn)了亞二次方復(fù)雜度。這些模型共同的特點(diǎn)是,在大部分或全部網(wǎng)絡(luò)層中,用線性或亞二次方注意力替代了傳統(tǒng)的二次方注意力,為長(zhǎng)文本處理和資源優(yōu)化提供了新思路。

然而,技術(shù)路線的探索并非一帆風(fēng)順。MiniMax團(tuán)隊(duì)在發(fā)布M1模型后不久,便悄然轉(zhuǎn)向。其新推出的2300億參數(shù)模型M2,出人意料地放棄了線性注意力,重新采用常規(guī)注意力機(jī)制。團(tuán)隊(duì)解釋稱,線性注意力在生產(chǎn)環(huán)境中表現(xiàn)“棘手”:盡管在常規(guī)提示任務(wù)中表現(xiàn)尚可,但在推理和多輪對(duì)話等關(guān)鍵場(chǎng)景中,精度問(wèn)題顯著——而這兩項(xiàng)能力正是聊天會(huì)話和智能體應(yīng)用的核心需求。這一決策一度引發(fā)行業(yè)對(duì)線性注意力實(shí)用性的質(zhì)疑。

就在爭(zhēng)議聲中,Kimi團(tuán)隊(duì)上周發(fā)布的Kimi Linear模型,為線性注意力注入了新活力。官方數(shù)據(jù)顯示,該模型通過(guò)混合注意力策略,實(shí)現(xiàn)了75%的KV緩存縮減和最高6倍的解碼吞吐量提升。其架構(gòu)設(shè)計(jì)融合了輕量級(jí)線性注意力與重量級(jí)全注意力:每三個(gè)采用Kimi Delta Attention(KDA)機(jī)制的Transformer塊,搭配一個(gè)使用多頭潛在注意力(MLA)的塊,比例固定為3:1。這一設(shè)計(jì)既保留了線性注意力的高效性,又通過(guò)全注意力層彌補(bǔ)了精度短板。

Kimi Linear的創(chuàng)新不僅體現(xiàn)在混合策略上。其線性部分采用的KDA機(jī)制,是對(duì)Gated DeltaNet的進(jìn)一步優(yōu)化;全注意力部分則用MLA替代了標(biāo)準(zhǔn)模塊,通過(guò)潛在空間映射降低計(jì)算開銷。盡管論文未直接對(duì)比Qwen3-Next,但與Gated DeltaNet-H1模型(滑動(dòng)窗口注意力與Gated DeltaNet的結(jié)合)相比,Kimi Linear在保持相同生成速度的同時(shí),實(shí)現(xiàn)了更高的建模精度。目前,MLA模塊尚未整合輸出門(sigmoid bypass),但團(tuán)隊(duì)計(jì)劃在未來(lái)版本中加入這一特性,以進(jìn)一步提升模型表現(xiàn)。

這場(chǎng)技術(shù)路線之爭(zhēng),折射出大語(yǔ)言模型發(fā)展中的深層矛盾:在算力資源有限與模型能力無(wú)限追求之間,如何找到平衡點(diǎn)?國(guó)產(chǎn)團(tuán)隊(duì)的探索表明,線性注意力并非“非此即彼”的選擇,而是可以通過(guò)混合策略、機(jī)制優(yōu)化等方式,在效率與精度間開辟新路徑。隨著Kimi Linear等模型的涌現(xiàn),行業(yè)對(duì)線性注意力的認(rèn)知正從“替代方案”轉(zhuǎn)向“補(bǔ)充工具”,其未來(lái)應(yīng)用場(chǎng)景或遠(yuǎn)超預(yù)期。

 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  爭(zhēng)議稿件處理  |  English Version
 
日本精品一区二区三区高清 久久
亚洲男人都懂的| 亚洲h精品动漫在线观看| 久久久精品黄色| 经典一区二区三区| 中文字幕免费观看一区| 91在线视频观看| 17c精品麻豆一区二区免费| 国产成人精品免费一区二区| 国产精品色一区二区三区| 成人动漫一区二区在线| 一区二区三区精品| 欧美人动与zoxxxx乱| 国产精品99久久久久| 中文字幕在线观看一区| 欧美人伦禁忌dvd放荡欲情| 国产综合色在线| 最新国产の精品合集bt伙计| 欧美影院一区二区| 国模大尺度一区二区三区| 国产精品美女久久久久av爽李琼| 日本久久电影网| 狠狠狠色丁香婷婷综合激情 | 久久成人久久爱| 亚洲免费在线视频| 精品国内片67194| 一本色道久久综合亚洲91| 另类人妖一区二区av| 国产精品久久久久久久午夜片| 欧美午夜不卡视频| 成人手机电影网| 日本va欧美va欧美va精品| 亚洲免费观看高清完整版在线观看 | 中文在线一区二区| 777午夜精品视频在线播放| 成人做爰69片免费看网站| 美女爽到高潮91| 午夜视频在线观看一区| 国产精品的网站| 久久一区二区三区四区| 制服丝袜日韩国产| 一本色道久久综合精品竹菊| 国产一区二区免费视频| 麻豆91在线看| 日韩av高清在线观看| 亚洲欧美日韩人成在线播放| 国产日韩欧美精品在线| 久久影视一区二区| 精品成人a区在线观看| 欧美日韩一区视频| 91福利社在线观看| 欧美在线观看视频一区二区三区| 成人免费电影视频| 国产99一区视频免费| 国产成人精品一区二区三区网站观看| 日本欧美一区二区| 奇米影视7777精品一区二区| 丝袜亚洲精品中文字幕一区| 亚洲午夜免费视频| 亚洲国产一区在线观看| 亚洲成av人片一区二区| 亚洲一区二区三区中文字幕在线| 一个色综合网站| 亚洲资源中文字幕| 亚洲高清视频的网址| 日韩成人一级片| 麻豆久久久久久久| 国产九色sp调教91| 亚洲欧美激情视频在线观看一区二区三区 | 欧美v日韩v国产v| 欧美一级二级三级乱码| 日韩色在线观看| 国产三区在线成人av| 国产精品久久久久久久久快鸭 | 亚洲一区二区三区激情| 午夜欧美大尺度福利影院在线看 | 欧美日韩在线播放三区四区| 欧美日韩一区三区四区| 日韩亚洲国产中文字幕欧美| 久久人人超碰精品| 欧美日韩在线电影| 日韩精品一区二区三区四区视频| 日韩一区和二区| 国产婷婷色一区二区三区四区| 欧美激情一区二区三区蜜桃视频| 国产精品电影院| 日韩国产成人精品| 成人中文字幕合集| 在线观看国产精品网站| 日韩一级视频免费观看在线| 国产午夜精品美女毛片视频| 一级日本不卡的影视| 国产一区二区三区日韩| 在线视频综合导航| 精品国产一区二区三区四区四| 亚洲国产精品av| 日日欢夜夜爽一区| av资源站一区| 欧美变态tickling挠脚心| 亚洲女同女同女同女同女同69| 久久精品国产在热久久| 日本电影欧美片| 国产日产欧美一区二区视频| 亚洲综合激情网| 丁香婷婷综合激情五月色| 欧美群妇大交群的观看方式| 国产精品蜜臀av| 精品一区二区三区欧美| 欧美午夜精品一区二区蜜桃| 国产亚洲女人久久久久毛片| 香蕉影视欧美成人| 91麻豆视频网站| 日本一区二区三区四区| 免费成人你懂的| 欧美三级日韩在线| 中文字幕不卡三区| 麻豆成人免费电影| 7777精品伊人久久久大香线蕉 | 欧美色偷偷大香| 自拍av一区二区三区| 国产成人免费在线视频| 日韩午夜激情电影| 视频一区二区三区在线| 欧美一a一片一级一片| 国产精品福利一区| 高清久久久久久| 国产亚洲欧美在线| 国产精品白丝av| 欧美精品一区二区三区蜜桃| 热久久国产精品| 精品在线观看视频| 欧美成人a视频| 蜜乳av一区二区| 精品国产成人系列| 日本美女一区二区三区视频| 欧美精品一二三| 天天亚洲美女在线视频| 欧美精品久久99| 日本午夜精品一区二区三区电影| 欧美日韩的一区二区| 亚洲高清久久久| 91精品国产综合久久精品图片| 亚洲成人激情av| 91精品国产91久久久久久最新毛片 | 亚洲一区二区三区四区在线免费观看 | 亚洲欧美乱综合| 在线免费观看日本一区| 亚洲午夜一区二区| 日韩欧美电影在线| 国产真实乱对白精彩久久| 久久久久久9999| 成人精品在线视频观看| 亚洲综合激情小说| 欧美一二区视频| 成人毛片在线观看| 一级特黄大欧美久久久| 日韩一级高清毛片| 国产成人aaaa| 亚洲一区二区欧美| 欧美tickling挠脚心丨vk| 国产suv一区二区三区88区| 1区2区3区国产精品| 欧美日韩成人综合| 国产91精品精华液一区二区三区| 亚洲视频免费看| 日韩一二三区不卡| www.久久久久久久久| 亚洲一区二区三区激情| 精品久久久久久久一区二区蜜臀| 99久久伊人精品| 日本美女一区二区| 日韩美女精品在线| 26uuu色噜噜精品一区二区| 99久久久无码国产精品| 极品销魂美女一区二区三区| 亚洲高清中文字幕| 亚洲精品中文字幕在线观看| 欧美精品一区二区三区蜜桃视频| 欧美三级视频在线观看| 9人人澡人人爽人人精品| 美女在线观看视频一区二区| 艳妇臀荡乳欲伦亚洲一区| 久久久久久免费网| 欧美tk—视频vk| 欧美一级视频精品观看| 91久久精品一区二区三区| 成人精品一区二区三区中文字幕| 裸体歌舞表演一区二区| 日韩国产精品久久久久久亚洲| 亚洲私人影院在线观看| 国产免费久久精品| 久久久蜜桃精品| 精品国产伦理网| 日韩免费看的电影| 9191久久久久久久久久久| 一本久道久久综合中文字幕| 成人午夜看片网址| 国产成人三级在线观看| 国产精品一区在线| 国产一区二区三区电影在线观看| 日韩电影一区二区三区|