在華為全聯接大會的舞臺上,一款具有劃時代意義的AI算力基礎設施——Atlas 960超節點正式亮相。這款產品的推出,不僅彰顯了華為在AI領域的技術實力,更預示著AI算力即將步入一個全新的發展階段。
Atlas 960超節點以華為自主研發的Ascend 960芯片為核心,實現了算力與規模的雙重突破。該超節點支持部署多達15488張昇騰卡,這一數字相較于前代產品實現了質的飛躍。整個系統由176個計算柜和44個互聯柜組成,盡管占地面積達到2200平方米,但在邏輯上卻高度一體化,宛如一臺巨型的智能計算機,展現出強大的計算能力。
在算力性能方面,Atlas 960超節點表現卓越。其FP8總算力高達30 EFLOPS(每秒百億億次浮點運算),而FP4總算力更是攀升至60 EFLOPS,這一水平遠超當前市場上的主流產品,為未來更復雜、更龐大的AI模型訓練提供了堅實的算力支撐。同時,該超節點的內存容量和互聯帶寬也得到了顯著提升,分別達到了4460TB和34PB/s,為大數據處理和實時分析提供了強有力的保障。
Atlas 960超節點的成功,離不開華為在芯片技術和系統架構上的深厚積累。Ascend 960芯片在算力上實現了翻倍,并支持華為自研的HiF4數據格式,進一步提升了推理吞吐和精度。在系統架構層面,華為引入了總線級互聯、平等協同、全量池化等設計理念,使得整個超節點系統能夠高效協同工作,發揮出最大的計算效能。
尤為引人注目的是,華為還為Atlas 960超節點配備了自研的“靈衢”(UnifiedBus)互聯協議。這一協議通過系統性創新,解決了長距離高可靠、大帶寬低時延等關鍵技術難題,為萬卡級超節點的實現提供了可能。同時,“靈衢”協議的引入也提升了系統的整體性能,為未來更大規模的超節點集群建設奠定了堅實基礎。
Atlas 960超節點的發布,將對AI產業產生深遠影響。其強大的算力和可擴展性,使其成為千億稠密、稀疏大模型訓練任務的理想選擇,同時也為未來萬億、十萬億參數級別的超大規模模型訓練提供了可能。這將極大地推動AI技術在各個領域的應用和創新,加速智能社會的到來。
Atlas 960超節點還支持UBoE與RoCE兩種組網協議,進一步提升了系統的靈活性和兼容性。用戶可以根據自身需求選擇合適的組網方式,從而降低部署成本和提高運維效率。這一設計使得Atlas 960超節點在應對不同場景和需求時更加游刃有余。