滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

英偉達聯手MIT及港大，Fast-dLLM框架讓語言模型推理速度飆升

時間：2025-06-03 14:29:02 來源：ITBEAR編輯：快訊團隊 發表評論無障礙通道

近期，科技界迎來了一項重大突破，英偉達攜手麻省理工學院及香港大學，共同推出了Fast-dLLM框架，這一創新成果極大地加速了擴散模型（基于擴散的語言模型）的推理速度，最高提速可達27.6倍，為語言模型的應用領域帶來了全新的可能性。

擴散模型作為自回歸模型的有力挑戰者，因其雙向注意力機制而備受矚目。理論上，這種機制能夠實現多詞元的同步生成，從而顯著提升解碼速度。然而，在實際應用中，擴散模型卻常常因計算成本高昂和生成質量受限而難以與自回歸模型相抗衡。具體來說，擴散模型在每次生成時都需要重復計算所有注意力狀態，導致計算效率低下。多詞元解碼過程中詞元間的依賴關系容易受到破壞，進而影響生成內容的準確性。

為了突破這些限制，英偉達研發團隊在Fast-dLLM框架中引入了兩項關鍵創新技術。第一項是塊狀近似KV緩存機制，通過將序列劃分為多個塊，并預計算存儲其他塊的激活值，有效減少了計算冗余。其進一步優化的DualCache版本則利用相鄰推理步驟的高度相似性，緩存前后綴詞元，進一步提升了效率。第二項創新是置信度感知并行解碼策略，該策略根據預設閾值選擇性解碼高置信度的詞元，避免了同步采樣可能引發的依賴沖突，確保了生成內容的質量。

Fast-dLLM框架在多項基準測試中展現出了卓越的性能。在GSM8K數據集上，該框架在生成長度為1024詞元的文本時，8-shot配置下實現了驚人的27.6倍加速，同時保持了76.0%的準確率。在MATH基準測試中，其加速倍數為6.5倍，準確率約為39.3%。在Humaneval和MBPP測試中，Fast-dLLM分別實現了3.2倍和7.8倍的加速，準確率保持在54.3%和接近基線水平。尤為在加速的同時，Fast-dLLM的準確率僅下降了1-2個百分點，展現了其在速度與準確性之間的出色平衡。

這一研究成果不僅為擴散模型在實際語言生成任務中的應用提供了強有力的支持，還使其具備了與自回歸模型競爭的實力。隨著Fast-dLLM框架的推廣和應用，我們有理由相信，擴散模型將在未來在更多領域展現出其獨特的優勢和潛力。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

全球首位QQ256級用戶誕生，解鎖“時光企鵝”等級圖標

06-07

雷軍自曝：購買小米YU7也得自掏腰包

今日，有網友在微博問“雷總你需要掏錢買YU7嗎？” 雷軍回答“當然需要”。此前有小米高管表示，員工買自家產品需原價甚至要搶的，至今可能只有小米和華為等少數企業。…

06-07

全球首位QQ 256級用戶誕生！你的等級是多少？騰訊高管都自愧弗如

06-07

英偉達RTX 5050現身PCI ID庫，7月或將發布新顯卡

06-07

首位QQ 256級大神誕生！你的等級到哪了？騰訊高管直呼自愧弗如

06-07

京東力推農產品新計劃：百大產地直供，百萬畝基地保真又實惠！

06-07

白象食品“多半”更名風波：以消費者為本，新名“面餅120克”出爐

06-07

小碼王學員藍橋青少STEMA省考大捷，全員獲獎彰顯編程教育實力！

06-07

“韋神”質樸出鏡吸粉無數，牙齒脫落引熱議，高考許愿能否成真？

06-07

英特爾頂尖芯片架構師另起爐灶，全力打造RISC-V最強CPU能否成功？

06-07

微軟Edge瀏覽器畫中畫升級：全新播放控制選項來襲！

06-07

諾基亞領航歐盟PROACTIF項目，打造公共安全無人機新篇章

06-07

白象更名“多半”為具體克重，產品透明度提升，行業規范化在行動

06-07

北大科研團隊創新技術：活體動物中精準激活蛋白質，開啟治療新篇章

06-07

張朝陽致敬極限探索者：時尚聚首，共話人生挑戰與意義

06-07

點擊查看更多 +

全站最新

雷軍親證：購買小米YU7，一視同仁需自費

極氪001榮膺中國外觀設計金獎，展現中國高端豪華新能源設計魅力

蘋果iPhone 17配置大曝光：120Hz屏幕、A18芯片等亮點搶先看

全球首位QQ256級用戶誕生，解鎖“時光企鵝”等級圖標

東風本田銷量斷崖式下滑，新能源戰略失誤成主因？

輕型動力新紀元！全國首分鐘級超充產業聯盟廬江啟航

熱門內容

本欄最新

全球首位QQ256級用戶誕生，解鎖“時光企鵝”等級圖標

雷軍自曝：購買小米YU7也得自掏腰包

全球首位QQ 256級用戶誕生！你的等級是多少？騰訊高管都自愧弗如

英偉達RTX 5050現身PCI ID庫，7月或將發布新顯卡

首位QQ 256級大神誕生！你的等級到哪了？騰訊高管直呼自愧弗如

京東力推農產品新計劃：百大產地直供，百萬畝基地保真又實惠！

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

英偉達聯手MIT及港大，Fast-dLLM框架讓語言模型推理速度飆升

日本精品一区二区三区高清久久