近期,半導體領域的權威研究與咨詢機構SemiAnalysis發表了一篇專題文章,聚焦華為云最新推出的AI算力集群解決方案——CloudMatrix 384(簡稱CM384)。文章指出,該解決方案憑借前所未有的系統架構設計以及全棧技術的革新,在關鍵性能指標上成功超越了英偉達的旗艦級產品GB200 NVL72,標志著中國在AI基礎設施的發展上取得了重大突破。
SemiAnalysis詳細披露,華為云CM384采用了384顆昇騰芯片為核心,通過創新的全互連拓撲架構,實現了芯片間的高效協同工作。這一設計使得CM384能夠提供高達300 PFLOPs的BF16密集算力,這一數字幾乎達到了英偉達GB200 NVL72系統的兩倍。CM384在內存容量與帶寬方面同樣表現出色,其總內存容量超過英偉達方案3.6倍,內存帶寬也實現了2.1倍的提升,為AI訓練和推理任務提供了更為強大的硬件支撐。
SemiAnalysis進一步分析,盡管單顆昇騰芯片的性能與英偉達Blackwell架構的GPU相比,僅有其三分之一左右,但華為通過巧妙的規模化系統設計,成功實現了整體算力的顯著提升。在超大規模模型訓練和實時推理等應用場景中,CM384展現出了更為強大的競爭力。SemiAnalysis強調,華為的工程優勢不僅體現在芯片層面,更在于其系統級的創新,包括網絡架構、光學互聯以及軟件優化等方面,這些創新使得CM384能夠充分發揮集群算力,滿足超大規模AI計算的需求。
此次CloudMatrix 384的發布,無疑是中國在AI計算系統領域的一次重要飛躍,展現了中國與國際巨頭正面競爭的實力。SemiAnalysis在文章中特別指出,華為的規模化解決方案在技術上已經領先于英偉達和AMD當前市場上的產品一代。這一突破不僅將推動中國AI產業的發展,更將對全球AI產業的格局產生深遠的影響。