在華為全聯接大會2025現場,華為輪值董事長徐直軍以“以開創的超節點互聯技術,引領AI基礎設施新范式”為主題發表演講,系統闡釋了華為在AI算力領域的戰略布局與技術突破。面對DeepSeek引發的產業變革,華為通過持續創新構建了覆蓋芯片、超節點、集群的全棧解決方案,為人工智能發展注入強勁動能。
針對昇騰生態建設,徐直軍宣布四項重大開源決策:堅持昇騰硬件商業化路徑的同時,全面開放CANN編譯器及虛擬指令集接口,相關軟件將于2025年底前完成開源;Mind系列開發工具鏈與openPangu大模型同步實現全棧開源。此舉旨在構建開放協同的AI生態,目前已有超過20個行業的300余套Atlas 900超節點完成部署。
在芯片技術層面,華為公布了未來三年昇騰系列演進路線。2026年一季度將推出的Ascend 950系列采用創新同構架構,支持SIMD/SIMT雙編程模型,內存訪問顆粒度降至128字節。該系列包含面向推薦場景的950PR(搭載HiBL 1.0內存)和專注訓練的950DT(配備HiZQ 2.0內存),互聯帶寬達2TB/s。后續規劃的960/970系列將在算力密度上持續突破,預計2028年四季度發布的970芯片將實現FP4算力8EFLOPS、互聯帶寬4TB/s的指標。
基于新一代芯片,華為推出革命性的超節點產品矩陣。Atlas 950超節點集成8192張昇騰卡,總算力達FP8 8EFLOPS、FP4 16EFLOPS,內存容量1152TB,互聯帶寬16PB/s,其性能指標全面超越英偉達NVL144方案6.7倍。更值得關注的是2027年四季度發布的Atlas 960超節點,支持15488卡規模,FP8算力躍升至30EFLOPS,內存容量達4460TB,可滿足十萬億參數大模型訓練需求。
通用計算領域同樣迎來突破。2026年一季度將推出的Kunpeng 950處理器提供96核/192線程和192核/384線程雙版本,首創四層隔離安全架構。基于該處理器的TaiShan 950超節點作為全球首個通用計算超節點,支持16節點32處理器配置,內存達48TB。通過與GaussDB分布式數據庫深度整合,該方案可使金融核心系統性能提升2.9倍,內存利用率提高20%,實時數據處理效率提升30%。
面對超節點互聯的技術挑戰,華為推出“靈衢”(UnifiedBus)互聯協議。該協議通過六層高可靠機制、百納秒級光路保護和新型光器件設計,實現200米以上可靠傳輸距離,可靠性提升100倍。在帶寬時延方面,通過多端口聚合技術達成2.1微秒超低時延,滿足萬卡級超節點組網需求。基于此協議的Atlas 950/960超節點已通過系統性驗證,華為同步開放靈衢2.0技術規范,邀請產業伙伴共建生態。
集群產品方面,2026年四季度將發布的Atlas 950 SuperCluster由64個超節點組成,集成52萬張昇騰卡,總算力達524EFLOPS,規模和算力均為當前世界最大集群xAI Colossus的2.5倍和1.3倍。該集群支持UBoE與RoCE雙協議組網,其中UBoE方案可節省40%交換機數量。2027年四季度推出的百萬卡級Atlas 960 SuperCluster更將FP8算力推升至2ZFLOPS,為萬億參數模型訓練提供算力基石。