在近期舉辦的華為全聯(lián)接大會上,華為公司正式發(fā)布了多款具備全球領(lǐng)先算力的產(chǎn)品,包括Atlas 950 SuperPoD和Atlas 960 SuperPoD超節(jié)點(diǎn),以及基于這些超節(jié)點(diǎn)構(gòu)建的Atlas 950 SuperCluster和Atlas 960 SuperCluster集群。這些產(chǎn)品被華為稱為當(dāng)前全球范圍內(nèi)算力最強(qiáng)的超節(jié)點(diǎn)和集群,標(biāo)志著華為在人工智能算力基礎(chǔ)設(shè)施領(lǐng)域邁出了重要一步。
Atlas 950 SuperPoD支持8192張昇騰卡,而Atlas 960 SuperPoD則支持15488張,在卡規(guī)模、總算力、內(nèi)存容量和互聯(lián)帶寬等關(guān)鍵指標(biāo)上均處于行業(yè)領(lǐng)先地位。華為表示,這兩款超節(jié)點(diǎn)在未來多年內(nèi)都將保持全球算力優(yōu)勢。基于超節(jié)點(diǎn)構(gòu)建的Atlas 950 SuperCluster和Atlas 960 SuperCluster集群,算力規(guī)模分別超過50萬卡和達(dá)到百萬卡,進(jìn)一步鞏固了華為在算力集群領(lǐng)域的領(lǐng)先地位。
除了針對人工智能領(lǐng)域的超節(jié)點(diǎn)產(chǎn)品,華為還將超節(jié)點(diǎn)技術(shù)引入通用計算領(lǐng)域,推出了全球首個通用計算超節(jié)點(diǎn)TaiShan 950 SuperPoD。結(jié)合GaussDB分布式數(shù)據(jù)庫,這款產(chǎn)品能夠替代傳統(tǒng)的大型機(jī)、小型機(jī)以及Exadata數(shù)據(jù)庫一體機(jī),成為各類計算場景的終結(jié)者。
華為副董事長、輪值董事長徐直軍在會上透露了華為昇騰芯片的未來發(fā)展規(guī)劃。他表示,昇騰芯片是華為AI算力戰(zhàn)略的核心,自2018年發(fā)布Ascend 310芯片和2019年發(fā)布Ascend 910芯片以來,華為不斷推動芯片技術(shù)的演進(jìn)。2025年發(fā)布的Ascend 910C芯片,隨著Atlas 900超節(jié)點(diǎn)的規(guī)模部署,已逐漸被市場熟知。
徐直軍指出,算力的基礎(chǔ)是芯片,而超節(jié)點(diǎn)已成為AI基礎(chǔ)設(shè)施建設(shè)的主導(dǎo)性產(chǎn)品形態(tài)。超節(jié)點(diǎn)本質(zhì)上是一臺能夠?qū)W習(xí)、思考和推理的計算機(jī),雖然物理上由多臺機(jī)器組成,但邏輯上以一臺機(jī)器的方式運(yùn)行。隨著算力需求的持續(xù)增長,超節(jié)點(diǎn)的規(guī)模也在不斷擴(kuò)大。
在技術(shù)挑戰(zhàn)方面,徐直軍坦言,華為在定義和設(shè)計Atlas 950、Atlas 960超節(jié)點(diǎn)時,面臨了長距離高可靠互聯(lián)和大帶寬低時延互聯(lián)兩大難題。當(dāng)前電互聯(lián)技術(shù)在高速時聯(lián)接距離短,光互聯(lián)技術(shù)雖能實(shí)現(xiàn)長距離聯(lián)接,但可靠性不足。跨柜卡間互聯(lián)帶寬和時延與超節(jié)點(diǎn)需求存在較大差距。
為解決這些問題,華為通過系統(tǒng)性創(chuàng)新,在互聯(lián)協(xié)議的每一層引入高可靠機(jī)制,并在光路中引入百納秒級故障檢測和保護(hù)切換。同時,華為重新定義和設(shè)計了光器件、光模塊和互聯(lián)芯片,使光互聯(lián)的可靠性提升100倍,互聯(lián)距離超過200米。華為還突破了多端口聚合與高密封裝技術(shù),實(shí)現(xiàn)了TB級超大帶寬和2.1微秒超低時延。
徐直軍強(qiáng)調(diào),正是這些系統(tǒng)性、原創(chuàng)性的技術(shù)創(chuàng)新,使華為攻克了超節(jié)點(diǎn)互聯(lián)技術(shù),滿足了高可靠、全光互聯(lián)、高帶寬、低時延的互聯(lián)要求。華為還開創(chuàng)了超節(jié)點(diǎn)架構(gòu)和新型互聯(lián)協(xié)議,能夠支撐萬卡級超節(jié)點(diǎn)架構(gòu),使數(shù)萬規(guī)模的計算卡能夠像一臺計算機(jī)一樣工作。
在昇騰芯片的未來規(guī)劃方面,徐直軍透露,未來三年至2028年,華為將開發(fā)和規(guī)劃三個系列芯片,包括Ascend 950系列(含Ascend 950PR和Ascend 950DT兩顆芯片)、Ascend 960系列和Ascend 970系列。其中,Ascend 950PR將于2026年第一季度推出,采用華為自研HBM技術(shù)。
徐直軍最后表示,算力過去是、未來也將繼續(xù)是人工智能發(fā)展的關(guān)鍵,尤其是中國人工智能發(fā)展的核心。基于全球最強(qiáng)算力的超節(jié)點(diǎn)和集群,華為對為人工智能的長期快速發(fā)展提供可持續(xù)且充裕的算力充滿信心。