2005年,英特爾前首席執行官保羅·歐德寧提出“Tick-Tock”戰略,以兩年為周期交替升級制程工藝與微架構,將摩爾定律推向新高度。這項被稱為“鐘擺革命”的計劃,不僅重塑了半導體產業格局,更奠定了英特爾在PC與服務器市場的長期優勢。而在中國科技發展進程中,也曾有過類似的雄心壯志——2018年華為發布全棧全場景AI戰略,次年推出昇騰910芯片,試圖在AI算力領域掀起一場中國版的“鐘擺革命”。
然而歷史總是充滿戲劇性。2019年美國將華為列入實體清單,2020年全面制裁海思,直接切斷了華為的芯片供應鏈。這場突如其來的科技鐵幕,讓中國AI算力領域的發展戛然而止。原本規劃中的昇騰演進路線被迫中斷,中國科技企業不得不面對一個殘酷現實:在AI算力這個關鍵領域,我們是否要永遠受制于人?
六年后,答案在華為全聯接大會2025上揭曉。華為副董事長徐直軍宣布推出全球最強算力超節點與集群解決方案,正式公布昇騰演進路標。這一舉動標志著,那個被中斷六年的“鐘擺革命”計劃,以全新的姿態回歸。徐直軍強調:“算力是中國人工智能發展的關鍵,我們將基于現有工藝打造‘超節點+集群’方案,滿足持續增長的需求。”
要理解這場回歸的意義,需要回到2019年那個轉折點。當時發布的昇騰910在性能上已與英偉達同期產品比肩,但制裁讓這款芯片的發展戛然而止。與此同時,AI大模型參數規模從2018年BERT-large的3.4億激增至2025年GPT-5的1.8萬億,算力需求呈現指數級增長。而英偉達則趁機鞏固地位,從2018年的Turing架構升級到2025年的Blackwell Ultra及Rubin架構,牢牢掌控全球AI算力市場。
制裁的影響遠不止于此。隨著AI算力成為戰略資源,美國持續升級對華封鎖,迫使英偉達推出性能縮水的“中國特供版”GPU。這種做法的本質,是通過算力供應限制來鎖死中國AI的發展上限。數據顯示,中國AI產業在半導體工藝上的長期落后,導致單卡性能與供貨量持續處于劣勢,迫使中國AI企業只能扮演技術跟隨者的角色。
面對這種困境,中國AI產業嘗試了各種應對方案:囤積算力卡、優化模型架構、提升算法效率。但這些措施都只能緩解短期壓力,無法從根本上解決算力困局。當被問及“如果模型參數繼續膨脹怎么辦?”“如果自動駕駛等新應用帶來算力爆發怎么辦?”時,行業普遍缺乏有效答案。中國AI需要的不是臨時解決方案,而是能夠支撐指數級增長的“無盡算力”。
華為的選擇是回歸基本原理:既然單顆芯片必然落后,那就通過多芯片組合來彌補。這種思路看似簡單,實則面臨巨大挑戰。AI任務雖然具有高并發特性,但要將大量芯片組合成有效算力,需要解決內存帶寬、互聯時延、系統調度等一系列復雜問題。這就像要在棋盤上同時移動數百枚棋子,每一步都要精準計算。
華為的突破首先體現在關鍵技術自研上。針對高性能計算必需的HBM技術,華為開發了HiBL 1.0和HiZQ 2.0兩種解決方案。前者降低了推理階段的投資成本,后者則滿足了訓練對互聯帶寬的高要求。這些自研技術逐步瓦解了“人有我無”的技術壁壘,為算力集群化奠定了基礎。
在網絡互聯這個傳統優勢領域,華為更是展現出深厚積累。通過多端口聚合、高密封裝技術,以及平等架構和統一協議,華為實現了TB級超大帶寬和2.1微秒超低時延的互聯方案——靈衢協議。這種技術突破使得大規模算力集群成為可能,而華為也宣布將開放靈衢2.0技術規范,與產業伙伴共建生態。
這些技術突破最終匯聚成“超節點+集群”的戰略方案。超節點將多個計算單元聯接成統一計算體,集群則將多個超節點通過網絡整合為可軟件調用的算力資源。這種架構巧妙地規避了單芯片性能限制,將算力競賽從“象棋對弈”轉變為“圍棋布局”——單個棋子價值有限,但整體布局能決定勝負。
2025年3月,華為推出Atlas 900超節點,集成384顆昇騰計算單元,算力達300 PFLOPS,創下全球紀錄。而在全聯接大會2025上發布的Atlas 950 SuperPoD和Atlas 960 SuperPoD超節點,分別支持8192和15488個計算單元聯接,在關鍵指標上全面領先。基于這些超節點構建的Atlas 950 SuperCluster和Atlas 960 SuperCluster集群,算力規模分別超過五十萬卡和百萬卡,確立了全球最強算力集群的地位。
這種領先優勢體現在具體數據上:Atlas 950超節點的算卡規模是英偉達NVL144的56.8倍,總算力是其6.7倍,內存容量是15倍,互聯帶寬是62倍。即使與英偉達計劃2027年推出的NVL576相比,華為方案在各方面依然保持領先。這意味著無論AI大模型如何發展,華為都能提供充裕算力,實現算力供給恒定大于模型創新需求的目標。
華為的創新并未止步于AI領域。全聯接大會上發布的TaiShan 950 SuperPoD通用計算超節點,結合GaussDB分布式數據庫,能夠替代傳統大型機和小型機。這種通算+智算的混合超節點架構,為生成式推薦系統開辟了全新發展方向,展現了華為技術的廣泛適用性。
“超節點+集群”戰略的本質,是重構AI算力的游戲規則。當單芯片性能比較變得意義有限時,華為通過系統級創新將算力競賽轉變為整體解決方案的競爭。這種轉變不僅規避了工藝限制,更將算力發展轉化為華為的戰略優勢。正如觀察家所言:“當對手改變規則時,最好的回應是創造新規則。”
這種戰略轉型的背后,是中國科技產業在逆境中的創新覺醒。制裁迫使中國科技企業跳出傳統發展路徑,在絕境中開辟新道路。華為六年來的技術積累,正是這種創新精神的集中體現。從關鍵技術自研到系統架構創新,從單機性能提升到集群效能優化,華為走出了一條獨特的算力發展道路。
這條道路的意義不僅在于技術突破。當“超節點+集群”方案完全基于中國大陸制造能力時,它實際上為中國AI產業構建了一個自主可控的算力基座。這個基座不僅能滿足當前需求,更能支撐未來通往AGI(通用人工智能)的漫長道路。國家不再需要擔心算力供應,產業界也能專注于創新而非生存。
當然,這種集群化算力方案也面臨挑戰。軟件管理復雜度和功耗問題是主要考量,但華為已經準備了充分解決方案。特別是在功耗方面,中國完善的基礎設施建設和新能源發展優勢,恰好轉化為算力集群的競爭力。這種“恰好”的匹配,或許就是中國科技產業對外部封鎖最有力的回應。
回顧華為六年來的發展軌跡,可以看到一條清晰的創新脈絡:從2019年昇騰910的驚艷亮相,到制裁下的沉默積累,再到2025年“超節點+集群”的戰略回歸。這條道路充滿了挫折與突破,但最終證明了一個道理:當外部壓力切斷傳統發展路徑時,真正的創新者會開辟出全新的道路。
如今,隨著華為昇騰路標的公布,AI算力領域正迎來新的變革契機。在全球AI算力需求持續激增的背景下,華為以幾乎一年一代的速度推進昇騰升級,這種發展節奏讓人想起六年前的“鐘擺革命”計劃。不同的是,這次中國科技企業不僅帶著更成熟的技術回歸,更掌握著改變游戲規則的能力。
這場由華為引領的算力革命,其意義已經超越了技術層面。它向世界證明,任何試圖通過封鎖來阻礙中國科技發展的企圖,最終都會激發出更強大的創新動力。當“超節點+集群”的算力旌旗在中國大地上展開時,它不僅代表著技術突破,更象征著一個產業在逆境中團結奮進的決心。
在這條由中國人自己撞出的算力之路上,每一步都凝聚著智慧與汗水。從關鍵技術突破到系統架構創新,從單機性能提升到集群效能優化,華為用實際行動詮釋了什么是真正的技術創新。這條道路或許曲折,但它通向的是一個不再受制于人的未來——在那里,中國AI要多少算力,就能提供多少算力。