日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

科大訊飛華為聯(lián)手,“飛星一號”MoE模型集群推理性能翻倍突破極限!

   時間:2025-04-18 16:09:48 來源:ITBEAR編輯:快訊團(tuán)隊 發(fā)表評論無障礙通道

科大訊飛與華為昇騰攜手,在“飛星一號”平臺上實現(xiàn)了MoE模型集群推理性能的顯著提升。這一突破性進(jìn)展,標(biāo)志著國產(chǎn)算力在AI領(lǐng)域的應(yīng)用邁出了重要一步。

據(jù)悉,雙方聯(lián)合團(tuán)隊通過一系列創(chuàng)新優(yōu)化手段,成功將MoE模型在“飛星一號”平臺上的集群推理性能翻倍。這一成就不僅彰顯了國產(chǎn)算力在處理復(fù)雜AI任務(wù)方面的潛力,更為AI技術(shù)的廣泛應(yīng)用提供了有力支持。

在此次優(yōu)化過程中,聯(lián)合團(tuán)隊針對MoE模型的特性,升級了PD分離+大規(guī)模專家并行系統(tǒng)解決方案。他們通過定制集合通信協(xié)議,有效消除了集合通信流量沖突,解決了推理過程中Prefill階段和Decode階段的相互干擾問題。這一創(chuàng)新舉措使得P實例和D實例均達(dá)到了系統(tǒng)最優(yōu)狀態(tài),性能提升超過20%。

聯(lián)合團(tuán)隊還在國產(chǎn)算力上實現(xiàn)了MTP多token預(yù)測技術(shù),這一技術(shù)的引入顯著降低了MTP層的計算耗時,整體性能提升超過30%。同時,他們還對專家負(fù)載均衡算法進(jìn)行了升級,實現(xiàn)了多DP負(fù)載均衡,卡間負(fù)載均衡差異小于8%,集群推理吞吐性能因此提升了30%以上。

聯(lián)合團(tuán)隊還創(chuàng)新性地實現(xiàn)了異步雙發(fā)射技術(shù)。這一技術(shù)有效解決了高并發(fā)下的高CPU負(fù)載問題,實現(xiàn)了CPU和NPU的高效協(xié)同。通過降低服務(wù)請求調(diào)度耗時,系統(tǒng)性能得到了進(jìn)一步提升,提升幅度達(dá)到10%。

基于上述一系列創(chuàng)新解決方案的迭代與升級,聯(lián)合團(tuán)隊在“飛星一號”平臺上對星火MoE模型、DeepSeekV3/R1進(jìn)行了實測。測試結(jié)果顯示,推理性能相較于上一個版本有了顯著提升,幾乎逼近了國產(chǎn)算力上MoE集群推理的性能上限。這一突破性進(jìn)展無疑為國產(chǎn)算力在AI領(lǐng)域的應(yīng)用注入了新的活力。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 兴山县| 常宁市| 宁强县| 聊城市| 龙海市| 丰都县| 陈巴尔虎旗| 贵州省| 太仆寺旗| 榆树市| 成安县| 韩城市| 沾益县| 陵水| 扶余县| 吉安市| 平谷区| 庆城县| 盈江县| 大安市| 海城市| 潢川县| 梅河口市| 正安县| 蒙自县| 辽宁省| 新昌县| 吴川市| 杂多县| 民权县| 嘉兴市| 定陶县| 泰州市| 许昌县| 莱州市| 苏尼特左旗| 怀来县| 桐城市| 西吉县| 崇州市| 会东县|