在2025年華為全聯接大會的現場,當“昇騰”二字以光影形式躍然于大屏幕之上時,會場內的空氣仿佛凝固了一瞬。沒有預想中的歡呼與掌聲,取而代之的是此起彼伏的深呼吸聲與泛紅的眼眶。這一刻,距離2018年昇騰310芯片問世、2019年昇騰910芯片發布,已跨越兩千多個日夜。這場跨越不僅記錄著技術迭代的軌跡,更鐫刻著一家企業在極端壓力下的生存智慧。
時間回溯至2019年春,美國制裁令華為供應鏈驟然緊繃。彼時華為輪值董事長徐直軍在發布昇騰910商用時仍保持從容,但暗流早已涌動。“當時備貨的昇騰910芯片,我們只敢供給國計民生領域客戶,互聯網企業都不敢賣。”他坦言,這場突如其來的風暴將華為從技術高光時刻推入孤立境地,芯片之路一度被外界視為“死局”。
真正的突圍始于對技術路徑的重新定義。當外界聚焦于單芯片性能時,華為已轉向系統級創新。2024年3月推出的Atlas 900超節點,通過384顆昇騰910C芯片構建起300 PFLOPS算力的計算集群,其CloudMatrix384云服務實例更被海外分析機構SemiAnalysis評價為“在多項關鍵指標上超越英偉達GB200 NVL72系統”。這種超越并非源于芯片制程優勢,而是源于對計算架構的顛覆性重構。
“英特爾曾允許我們使用CPU互聯協議,后來連這個都被禁止了。”徐直軍揭示技術突圍的艱辛歷程。從光器件到互聯芯片,華為不得不重新定義每個技術環節。這種全鏈條自主創新催生出獨特的超節點架構——通過靈衢互聯協議,將數萬顆計算卡連接成邏輯上的單一計算體。相較于英偉達NVlink的封閉生態,華為選擇開放靈衢2.0技術規范,試圖構建更廣闊的產業生態。
在芯片規劃層面,華為展現出激進的技術演進路線。至2028年,昇騰系列將形成Ascend 950/960/970三大產品矩陣,算力密度每年翻倍提升。其中970系列支持4TB/s互聯帶寬,FP4算力達8 PFLOPS,自研HBM內存帶寬較前代翻四番。這些參數背后,是華為對AI訓練需求爆炸式增長的精準預判。
生態建設成為另一場靜默的革命。面對開發者對CUDA生態的路徑依賴,華為堅持打造CANN生態與MindSpore框架。“就像談戀愛,不用怎么知道合不合適?”徐直軍比喻道。這種看似“逆流”的選擇,實則是為構建不受西方技術體系制約的自主生態鋪路。當被問及與英偉達的競爭時,他直言:“除了單芯片算力小一點、功耗大一點,其他都是優勢。”
超節點戰略的深層邏輯在于將技術短板轉化為系統優勢。2022年英偉達DGX H100 NVL256項目因成本與可靠性問題擱淺,而華為最新發布的Atlas 950/960 SuperPoD超節點分別支持8192及15488張昇騰卡,算力規模突破百萬卡級別。這種集群化部署不僅規避了芯片制程限制,更通過光通信技術實現低損耗、長距離互聯——相較于英偉達的全銅通信方案,華為的光模塊策略使單節點可連接芯片數量提升數個量級。
“創新有時是被逼出來的。”徐直軍坦陳技術突圍的無奈與必然。當海思芯片暫時失去制程優勢,華為轉而通過“非摩爾補摩爾”策略,在系統架構、數學算法等領域構建護城河。這種轉型在靈衢互聯協議上體現得尤為明顯,其通過正向負向全雙工傳輸設計,解決了大模型訓練中前所未有的數據洪流挑戰。
在華為的技術版圖中,超節點與集群戰略已上升為核心層級。這種選擇既是對現實約束的妥協,更是對未來計算形態的前瞻布局。當業界仍在討論單芯片性能時,華為已通過系統級創新證明:真正的算力革命不在于晶體管密度的競賽,而在于如何讓數萬顆芯片協同演繹出超越物理極限的計算樂章。