近期,美國對向中國出口芯片的限制措施,讓英偉達的首席執行官黃仁勛深感憂慮。他的擔憂源自于對中國本土算力發展的深刻認識。
近期,華為推出了一款名為CloudMatrix 384(簡稱CM384)的AI算力集群解決方案,初看之下似乎并無驚艷之處,但深入探究后,其蘊含的影響力不容小覷。
華為方面透露,CM384基于384顆昇騰芯片構建,采用全互連拓撲架構,實現了芯片間的高效協同作業。其算力表現驚人,能提供高達300 PFLOPs的密集BF16算力,這一數據幾乎達到了英偉達GB200 NVL72系統算力的兩倍。
不僅如此,CM384在內存容量和帶寬方面同樣有著卓越表現。其總內存容量是英偉達同類方案的3.6倍,內存帶寬更是達到了2.1倍,為AI訓練和推理任務提供了更為堅實的硬件基礎。
盡管單顆昇騰芯片的性能相較于英偉達的Blackwell架構GPU有所不及,大約僅為后者的三分之一,但華為通過巧妙的規模化系統設計,成功實現了整體算力的顯著提升。特別是在超大規模模型訓練和實時推理等應用場景中,華為CM384展現出了更為強大的競爭力。
國外投行對此給予了高度評價,認為華為的規模化解決方案已經領先于英偉達和AMD當前市場上的產品一代。同時,這一突破也被視為中國在AI基礎設施領域的重要里程碑,將對全球AI產業的競爭格局產生深遠影響。