在華為全聯(lián)接大會的會場上,當(dāng)大屏幕亮起“昇騰”二字時,原本喧鬧的會場瞬間安靜下來。沒有預(yù)想中的歡呼與掌聲,有人屏息凝神,有人紅了眼眶。這一刻,距離華為首次發(fā)布昇騰310芯片已過去兩千多個日夜,而昇騰系列的正式回歸,讓所有參與者既感慨又復(fù)雜。
華為的AI芯片之路始于2018年昇騰310的發(fā)布,次年昇騰910緊隨其后。然而,2019年春天的制裁風(fēng)暴讓供應(yīng)鏈幾近斷裂。當(dāng)時,華為仍按原計劃推進昇騰910的商用發(fā)布,但暗流已悄然涌動。徐直軍回憶,受限于備貨量,昇騰910最初僅供應(yīng)國計民生領(lǐng)域客戶,互聯(lián)網(wǎng)行業(yè)的需求被迫擱置。這場制裁不僅打亂了華為的節(jié)奏,更將其從技術(shù)巔峰推向了孤立境地。
面對外部壓力,華為的選擇并非退縮。Mate 60手機、鴻蒙系統(tǒng)、metaERP等產(chǎn)品的推出,展現(xiàn)了其技術(shù)韌性。但真正的戰(zhàn)場在AI算力領(lǐng)域——海思、云計算、數(shù)據(jù)中心等團隊紛紛投入研發(fā),試圖在芯片受限的背景下開辟新路徑。2025年3月,華為推出的Atlas 900超節(jié)點成為關(guān)鍵轉(zhuǎn)折點。這款滿配384顆昇騰910C芯片的設(shè)備,算力達300 PFLOPS,至今仍是全球算力最大的超節(jié)點。其衍生出的CloudMatrix384云服務(wù)實例,更被海外機構(gòu)評價為“領(lǐng)先英偉達、AMD一代”的技術(shù)方案。
“制裁逼我們重新定義一切。”徐直軍坦言。從光器件到互聯(lián)協(xié)議,從芯片設(shè)計到超節(jié)點架構(gòu),華為被迫走出一條自主之路。例如,英偉達曾允許華為使用其CPU互聯(lián)協(xié)議,但制裁后這一路徑被切斷,華為只能自主研發(fā)靈衢互聯(lián)協(xié)議。這一協(xié)議不僅實現(xiàn)了數(shù)萬顆芯片的協(xié)同工作,更被海外企業(yè)視為“超節(jié)點技術(shù)的核心秘密”。
在芯片規(guī)劃方面,華為展現(xiàn)了激進的迭代策略。至2028年,昇騰系列將推出Ascend 950、960、970三大系列,算力每年翻倍。其中,950系列支持FP8算力1 PFLOPS,970系列則提升至4 PFLOPS;互聯(lián)帶寬從2TB/s擴展到4TB/s;內(nèi)存容量和訪問帶寬同步翻倍。這些升級旨在滿足AI模型對算力的指數(shù)級需求。
但芯片并非華為AI戰(zhàn)略的全部。徐直軍強調(diào),“超節(jié)點+集群”才是核心。以Atlas 950 SuperPoD為例,其支持8192張昇騰卡,算力規(guī)模超50萬卡;Atlas 960 SuperPoD更達15488張卡,算力百萬卡級。這種架構(gòu)通過靈衢協(xié)議將分散的芯片整合為“一臺計算機”,實現(xiàn)學(xué)習(xí)、推理等功能的統(tǒng)一調(diào)度。相比之下,英偉達的GB200 NVL72超節(jié)點因成本、功耗和可靠性問題,規(guī)模大幅縮減。
生態(tài)建設(shè)是另一大挑戰(zhàn)。國內(nèi)開發(fā)者對昇騰生態(tài)的接受度仍待提升,徐直軍以“戀愛”比喻:“不用怎么知道合不合適?問題要在使用中解決。”盡管華為的工具鏈與英偉達存在差距,但拒絕兼容CUDA生態(tài)的選擇源于長遠考量。“如果依賴CUDA舊版本,哪天被切斷怎么辦?”他指出,華為從達芬奇架構(gòu)到昇騰芯片,已構(gòu)建起不依賴西方生態(tài)的完整體系。
超節(jié)點的優(yōu)勢在于將單芯片劣勢轉(zhuǎn)化為系統(tǒng)優(yōu)勢。徐直軍承認,昇騰芯片在制程和功耗上暫落后于英偉達,但通過超節(jié)點架構(gòu),華為實現(xiàn)了算力總和的超越。“AI本質(zhì)是并行計算,384顆芯片的協(xié)同效果遠超單顆性能。”他進一步解釋,超節(jié)點像一臺計算機,集群則如云服務(wù),通過軟件層調(diào)度多個超節(jié)點,形成彈性算力網(wǎng)絡(luò)。
靈衢互聯(lián)協(xié)議的開放是華為生態(tài)戰(zhàn)略的關(guān)鍵一步。與英偉達NVlink的封閉性不同,華為宣布開放靈衢2.0技術(shù)規(guī)范,旨在吸引更多企業(yè)參與算力集群建設(shè)。“硬件變現(xiàn)是我們的理念,但靈衢若僅限華為使用,就無法形成生態(tài)。”徐直軍認為,只有產(chǎn)業(yè)雪球滾大,中國AI算力才能真正獨立。
華為的技術(shù)路線融合了多年通信積累。例如,英偉達超節(jié)點采用全銅通信,傳輸距離僅2米;而華為的光通信策略通過光模塊實現(xiàn)低損耗、長距離傳輸,支持更多芯片互聯(lián)。這一選擇曾被質(zhì)疑風(fēng)險過高,但華為憑借光芯片和故障恢復(fù)技術(shù),成功將光模塊故障率控制在可接受范圍。
“這條路是被逼出來的,但也是唯一能走通的路。”徐直軍總結(jié)。從芯片到超節(jié)點,從協(xié)議到生態(tài),華為的AI戰(zhàn)略已超越技術(shù)范疇,成為一場關(guān)于系統(tǒng)能力的綜合較量。當(dāng)被問及是否擔(dān)心模仿者時,他回應(yīng):“誰想重復(fù)別人的路?我們更愿意開創(chuàng)未來。”