AI算力領(lǐng)域正經(jīng)歷一場(chǎng)深刻變革,而這場(chǎng)變革的引領(lǐng)者來(lái)自中國(guó)。面對(duì)當(dāng)前AI基礎(chǔ)設(shè)施建設(shè)中“規(guī)模越大,效率越低”的困境,華為在全聯(lián)接大會(huì)上推出了一項(xiàng)顛覆性技術(shù)——基于靈衢互聯(lián)協(xié)議的超節(jié)點(diǎn)架構(gòu),為大規(guī)模AI計(jì)算開(kāi)辟了全新路徑。
傳統(tǒng)AI集群的擴(kuò)張模式已陷入瓶頸。當(dāng)數(shù)萬(wàn)個(gè)計(jì)算單元需要協(xié)同處理萬(wàn)億參數(shù)模型時(shí),以太網(wǎng)等傳統(tǒng)互聯(lián)方式就像狹窄的水道,導(dǎo)致數(shù)據(jù)擁堵、計(jì)算單元閑置。據(jù)統(tǒng)計(jì),在現(xiàn)有架構(gòu)下,約40%的訓(xùn)練時(shí)間被浪費(fèi)在等待數(shù)據(jù)傳輸上,任何節(jié)點(diǎn)的故障都可能引發(fā)連鎖反應(yīng),導(dǎo)致耗時(shí)數(shù)周的訓(xùn)練任務(wù)中斷。
華為的解決方案直指核心痛點(diǎn)——打破計(jì)算單元間的“通信墻”。通過(guò)自研的靈衢互聯(lián)協(xié)議,華為將多臺(tái)物理服務(wù)器融合為一個(gè)邏輯上的“超級(jí)計(jì)算機(jī)”。這種架構(gòu)不是簡(jiǎn)單的硬件堆砌,而是從系統(tǒng)層面重構(gòu)了計(jì)算、存儲(chǔ)和通信的關(guān)系。大帶寬、低時(shí)延的互聯(lián)網(wǎng)絡(luò)使全局資源池化成為可能,計(jì)算單元、存儲(chǔ)單元得以平等交互,通信時(shí)延被壓縮至百納秒級(jí)。
這一技術(shù)突破已通過(guò)實(shí)踐驗(yàn)證。華為董事、ICT BG CEO楊超斌透露,基于靈衢協(xié)議的超節(jié)點(diǎn)架構(gòu)已實(shí)現(xiàn)超大規(guī)模部署,其性能領(lǐng)先性超越了國(guó)際同類方案。例如,NVL144的上市計(jì)劃因技術(shù)難題推遲至明年下半年,而華為的超節(jié)點(diǎn)技術(shù)已進(jìn)入成熟應(yīng)用階段。
超節(jié)點(diǎn)架構(gòu)的“融合”特性體現(xiàn)在多個(gè)維度。在物理層面,它由多臺(tái)機(jī)器組成;在邏輯層面,卻如同單一設(shè)備般運(yùn)作。統(tǒng)一通信協(xié)議與內(nèi)存編址的設(shè)計(jì),消除了傳統(tǒng)集群中因協(xié)議差異導(dǎo)致的效率損耗。這種設(shè)計(jì)使有效算力能夠隨集群規(guī)模線性增長(zhǎng),同時(shí)顯著提升了系統(tǒng)的可靠性。
針對(duì)不同場(chǎng)景的需求,華為推出了覆蓋全鏈條的產(chǎn)品組合。旗艦產(chǎn)品Atlas 950 SuperPoD和Atlas 960 SuperPoD專為頂級(jí)玩家設(shè)計(jì),分別支持8192張和15488張昇騰卡。其全液冷架構(gòu)和零線纜電互聯(lián)技術(shù),解決了超高密度部署的散熱與可靠性難題。FP8算力達(dá)8E FLOPS,總互聯(lián)帶寬16PB/s,相當(dāng)于當(dāng)前全球互聯(lián)網(wǎng)峰值帶寬的10倍以上。
企業(yè)級(jí)市場(chǎng)則迎來(lái)了更具普惠性的解決方案。Atlas 850作為業(yè)界首款風(fēng)冷AI超節(jié)點(diǎn)服務(wù)器,將超節(jié)點(diǎn)架構(gòu)帶入標(biāo)準(zhǔn)風(fēng)冷機(jī)房。企業(yè)無(wú)需改造現(xiàn)有基礎(chǔ)設(shè)施,即可在單柜20千瓦的機(jī)房?jī)?nèi)構(gòu)建1024卡集群。這一設(shè)計(jì)大幅降低了超節(jié)點(diǎn)的應(yīng)用門檻,為行業(yè)大模型的“后訓(xùn)練”和多場(chǎng)景推理提供了可能。
在基礎(chǔ)計(jì)算單元層面,基于昇騰950PR芯片的Atlas 350標(biāo)卡實(shí)現(xiàn)了性能躍升。推薦推理場(chǎng)景性能提升2.5倍的同時(shí),通過(guò)靈衢端口支持多卡互聯(lián)與資源池化。這種“可拆可合”的特性,使用戶能夠根據(jù)需求靈活組裝小型超節(jié)點(diǎn),運(yùn)行更大參數(shù)的模型或更低時(shí)延的應(yīng)用。
超節(jié)點(diǎn)架構(gòu)的應(yīng)用邊界正在擴(kuò)展。TaiShan 950 SuperPoD將其引入通用計(jì)算領(lǐng)域,百納秒級(jí)超低時(shí)延和內(nèi)存池化能力,為數(shù)據(jù)庫(kù)、虛擬化等對(duì)延遲敏感的場(chǎng)景帶來(lái)性能提升。基于該架構(gòu)打造的GaussDB多寫架構(gòu),可直接替代傳統(tǒng)大型機(jī)數(shù)據(jù)庫(kù),為傳統(tǒng)IT架構(gòu)升級(jí)提供了新選擇。
華為的野心不止于技術(shù)突破,更在于構(gòu)建開(kāi)放生態(tài)。在硬件層面,NPU模組、刀片、主板等基礎(chǔ)組件向合作伙伴開(kāi)放,鼓勵(lì)二次開(kāi)發(fā);在軟件層面,昇騰CANN和操作系統(tǒng)靈衢組件全面開(kāi)源,代碼將融入openEuler等社區(qū),并優(yōu)先支持PyTorch、vLLM等主流框架。這種“硬件開(kāi)放、軟件開(kāi)源”的策略,旨在吸引更多開(kāi)發(fā)者和廠商參與,共同豐富超節(jié)點(diǎn)生態(tài)。
目前,基于靈衢協(xié)議的Atlas 900 A3超節(jié)點(diǎn)已部署300余套,服務(wù)20余個(gè)客戶,覆蓋互聯(lián)網(wǎng)、金融、運(yùn)營(yíng)商、電力、制造等行業(yè)。新一代超節(jié)點(diǎn)在真實(shí)場(chǎng)景中驗(yàn)證了其價(jià)值,證明這一技術(shù)路線不僅能夠解決大規(guī)模計(jì)算的效率難題,更能為不同行業(yè)提供適配的算力解決方案。