第22屆中國計算機大會在哈爾濱拉開帷幕,這場以“數智賦能,無限可能”為主題的科技盛會吸引了眾多行業目光。在大會現場,華為數據通信產品線研究部部長鄭曉龍發表了題為《大模型推理加速與演進:網絡如何破局?》的精彩演講,首次提出“網絡+”破局模型,為十萬卡智算集群面臨的通信難題帶來了創新性的解決方案。
鄭曉龍在演講中指出,當下單卡算力的提升速度逐漸放緩,要實現集群效率的飛躍,必須依靠網絡、計算與存儲的跨層協同。基于此,華為提出了“網絡+”破局模型,旨在系統性地攻克超大規模集群中的通信瓶頸問題。該模型從架構設計、協議優化以及調度策略等多個維度展開,為構建下一代智算基礎設施勾勒出完整的技術路線。
隨著DeepSeek推動大模型架構向更稀疏的大EP部署轉變,通信模式和關系發生了顯著變化,呈現出隨機性和非對稱性的特點。為應對這一挑戰,華為推出了網絡級負載均衡技術。該技術能夠有效應對大EP部署帶來的動態通信模式難題,將通信性能提升超過20%,同時顯著降低P99完成時間,為智算集群的高效運行提供了有力保障。
大模型應用的發展趨勢也在不斷變化,從聊天式的Chat LLM向Agentic AI演進,對token生成速度的要求從50ms大幅提升至10ms以下。然而,當前部署實踐面臨諸多挑戰,推理階段以小消息通信為主,控制面時延占比過高;若單純卸載控制面,又會消耗計算資源SM。針對這些問題,華為推出了CloudMatrix384超節點及對應的超節點網絡,為滿足極致的TPOT需求提供了可能,助力大模型應用在新的發展階段實現更高效運行。
在多模態LMM流量混戰的大背景下,網絡調度發揮著關鍵作用。鄭曉龍強調,“網絡+”并非簡單的帶寬升級,而是要讓網絡成為AI集群的“第七代算力”。華為的網絡調度技術如同“四兩撥千斤”,能夠有效提升推理性能。最后,鄭曉龍呼吁業界各方攜手共建標準,與合作伙伴及行業組織共同定義大模型時代下一代智算網絡接口,推動整個行業的協同發展。











