日本精品一区二区三区高清久久

<rt id="cwmks"></rt>

ITBear科技資訊
手機版
二維碼
內容搜索
無障礙通道
語言：中文 EN

ITBear旗下自媒體矩陣：

滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

字節Seed團隊新突破：PHD-Transformer如何破解預訓練長度與KV緩存難題？

時間：2025-04-28 16:54:01 來源：ITBEAR編輯：快訊團隊 IP：北京 發表評論無障礙通道

字節跳動旗下的Seed團隊近期在人工智能領域取得了新的突破，他們研發出一種名為PHD-Transformer（Parallel Hidden Decoding Transformer）的新型模型，該模型在預訓練長度擴展方面展現出了非凡的能力，有效解決了推理過程中KV緩存膨脹的難題。隨著大型推理模型的快速發展，如何在后訓練階段生成更長的推理鏈，并在復雜任務上取得優異表現，成為了研究人員關注的焦點。Seed團隊受此啟發，決定在預訓練階段就進行長度擴展的探索。

傳統方法在處理長度擴展時，通常會在序列中插入額外的文本或潛在向量，但這種方式會導致KV緩存占用大量內存，從而影響推理速度。而PHD-Transformer則采用了更為高效的策略，即直接重復輸入的tokens。然而，這種方法雖然提升了訓練損失和模型性能，但也帶來了新的問題，如KV緩存的線性增長、內存壓力的增加以及解碼延遲的加劇。

為了克服這些挑戰，PHD-Transformer引入了創新的KV緩存管理策略。在推理過程中，該模型只保留由原始tokens生成的KV緩存，對于重復的tokens，則在預測完成后立即丟棄。這一策略顯著提升了推理速度。研究團隊還開發了一種稱為PHD-SWA（Sliding Window Attention）的滑動窗口注意力機制，以保持局部滑動窗口緩存的性能優勢。為了進一步優化預填充時間，他們提出了PHD-CSWA（Chunk-wise Sliding Window Attention）機制，通過限制每個塊內的順序依賴，大幅縮短了預填充時間。

在一系列嚴格的實驗中，PHD-CSWA展現出了卓越的性能。在多個公開的基準測試集上，該模型均實現了準確率的提升。Seed團隊表示，PHD-CSWA在保持原有高效性的基礎上，為模型帶來了更大的性能飛躍，這標志著在大規模推理任務中，預訓練長度擴展技術取得了實質性的進步。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

榮耀Magic V5大揭秘：青海湖刀片電池助力，續航突破6100mAh

06-25

廣和通2025世界移動通信大會秀AI+物聯網前沿技術與應用

“IoT World 萬物互聯”展區集中展示廣和通在移動寬帶、智慧零售、智慧城市等垂直行業的落地成果，包括多款基于廣和通模組及FWA PCBA解決方案的終端應用產品、多款搭載廣和通智能模組的ECR收銀終端、…

06-25

智慧旅游新動力：物聯網、大數據、云計算與AI共筑未來

智慧旅游的支撐技術包括物聯網、大數據、云計算和人工智能等。物聯網技術通過傳感器和智能設備實現景區環境實時監控，例如智能攝像頭監測游客流量，傳感器監測空氣質量。大數據技術則通過分析游客行為數據，優化服務和產品…

06-25

榮耀X70配置亮點搶先看：7800mAh電池搭配80W快充引期待

具體來說，來自互聯網上的最新爆料信息顯示，榮耀X70這款智能手機代號Martin，之前數碼博主摸到的工程機是約6.79英寸的1.5K分辨率OLED直屏，支持80W快充，一顆低功耗處理器，有月影白、竹韻青、幻…

06-25

Win10即將終止支持，微軟力推Win11：安全提速新體驗等你來升級

微軟在最新博客文章中，先是列舉了Windows 10結束支持后用戶可能面臨的困境，屆時微軟將不再為Windows10提供安全更新、功能更新和技術支持。微軟還提到了任務欄和開始菜單的更簡潔外觀，但這正是許…

06-25

訊飛醫療科技香港啟航，星火醫療大模型國際化戰略布局加速

在同期舉辦的論壇上，訊飛醫療科技正式發布星火醫療大模型 V2.5 國際版。訊飛醫療科技總裁陶曉東告訴智通財經APP，這是訊飛醫療科技“立足大灣區、輻射全球”戰略的關鍵一步，公司將以香港為支點，逐步拓展國際…

06-25

訊飛醫療科技香港啟航，全球化版圖再添重要一環

在同期舉辦的論壇上，訊飛醫療科技正式發布星火醫療大模型 V2.5 國際版。訊飛醫療科技總裁陶曉東告訴智通財經 APP，這是訊飛醫療科技“立足大灣區、輻射全球” 戰略的關鍵一步，公司將以香港為支點，逐步拓…

06-25

榮耀Magic V5大折疊屏新機：青海湖刀片電池續航突破6100mAh

作為榮耀旗下新一代大折疊屏旗艦手機，榮耀Magic V5不僅延續了品牌“輕薄”理念，更在電池技術上實現重大突破。據透露，榮耀Magic V5搭載了最新的青海湖刀片電池，這是行業內超薄電池的代表，首次實現了折…

06-25

周鴻祎達沃斯論壇解析AI進化：智能體時代將重塑人與技術協作

“如果只把大模型當作工具來用，或許只能提升30%、50%的效率；但當大模型進化為智能體，使其像數字助理一樣幫人們處理各種復雜工作，人的角色就會轉變為領導智能體、規劃人工智能、管理人工智能，人也將變為超級個體。…

06-25

榮耀Magic V5大揭秘：青海湖刀片電池突破6100mAh，輕薄與續航并存

06-25

周鴻祎達沃斯論壇論道：人工智能進化智能體，開啟產業與人類協作新篇章

06-25

周鴻祎清華讀博體驗：60頁開題報告遭批，畢業率僅5%需奮力一搏

06-25

AI熱潮下，全球十大芯片設計廠商一季度營收大漲超770億美元

06-25

全球最強編碼模型Claude 4已上線亞馬遜云科技Amazon Bedrock，如何使用？

06-25

科大訊飛6月24日融資凈買入超三千萬，融資余額穩居近一年低位

融券方面，科大訊飛6月24日融券償還1.72萬股，融券賣出8100.00股，按當日收盤價計算，賣出金額37.86萬元；融券余量20.69萬股，融券余額967.25萬元，低于近一年10%分位水平，處于低位。 …

06-25

點擊查看更多 +

全站最新

vivo X Fold5發布：全球最輕大折疊旗艦，三防續航影像全面升級

vivo X Fold5：輕薄折疊新標桿，性能與便攜的完美融合

榮耀Magic V5大揭秘：青海湖刀片電池助力，續航突破6100mAh

vivo X Fold5：輕薄與大屏兼得，折疊屏手機新體驗

iPhone 17 Pro機模亮相：橫向“攝像頭條”設計成新焦點

vivo X Fold5：6999元起售，折疊屏最輕紀錄，辦公新利器

熱門內容

本欄最新

榮耀Magic V5大揭秘：青海湖刀片電池助力，續航突破6100mAh

廣和通2025世界移動通信大會秀AI+物聯網前沿技術與應用

智慧旅游新動力：物聯網、大數據、云計算與AI共筑未來

榮耀X70配置亮點搶先看：7800mAh電池搭配80W快充引期待

Win10即將終止支持，微軟力推Win11：安全提速新體驗等你來升級

榮耀Magic V5大折疊屏新機：青海湖刀片電池續航突破6100mAh

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

主站蜘蛛池模板：开原市| 航空| 兴山县| 莲花县| 曲沃县| 正定县| 垦利县| 定日县| 湛江市| 宁明县| 峡江县| 泸西县| 偃师市| 新建县| 商河县| 绵竹市| 黄梅县| 神木县| 偏关县| 新野县| 抚宁县| 永吉县| 赣榆县| 全南县| 溧水县| 青州市| 鲁山县| 武川县| 怀柔区| 东丰县| 峨眉山市| 塔河县| 汾阳市| 永寿县| 昆山市| 深水埗区| 启东市| 城口县| 本溪市| 浮山县| 泽州县|

日本精品一区二区三区高清 久久

字節Seed團隊新突破：PHD-Transformer如何破解預訓練長度與KV緩存難題？

日本精品一区二区三区高清久久