在全球人工智能算力競爭日益激烈的當(dāng)下,技術(shù)迭代的速度不斷加快,華為的戰(zhàn)略重心正從單一產(chǎn)品性能的突破轉(zhuǎn)向生態(tài)體系的系統(tǒng)性建設(shè)。在華為全聯(lián)接大會(huì)上,公司高層多次強(qiáng)調(diào),生態(tài)的繁榮是推動(dòng)產(chǎn)業(yè)發(fā)展的核心動(dòng)力,也是支撐企業(yè)長期增長的關(guān)鍵基石。此次大會(huì)上,“開放、合作、共贏”的理念被反復(fù)提及,成為華為未來發(fā)展的核心方向。
昇騰計(jì)算業(yè)務(wù)總裁在會(huì)上宣布,成立CANN技術(shù)指導(dǎo)委員會(huì),并承諾每年投入1500P算力資源及3萬片開發(fā)板,支持全球開發(fā)者共同參與生態(tài)建設(shè)。這一舉措標(biāo)志著華為不再局限于單點(diǎn)性能的競爭,而是通過全棧開源和硬件開放,將工具鏈、編譯器、框架等核心技術(shù)全面開放給開發(fā)者,同時(shí)提供模組、標(biāo)卡和超節(jié)點(diǎn)等硬件資源,旨在夯實(shí)人工智能產(chǎn)業(yè)的算力基礎(chǔ)。
過去,昇騰的核心軟件棧CANN主要由華為內(nèi)部主導(dǎo)開發(fā),外部開發(fā)者參與的門檻較高。如今,華為計(jì)劃在年底前完成CANN全棧的開源,涵蓋編譯器、算子庫、運(yùn)行時(shí)和底層接口等模塊。這一變革不僅體現(xiàn)在口號(hào)上,更在架構(gòu)層面進(jìn)行了根本性調(diào)整。通過分層解耦設(shè)計(jì),開發(fā)者可以根據(jù)需求靈活調(diào)用模型、算子、內(nèi)核和底層資源。對(duì)于追求極致性能的開發(fā)者,華為還開放了底層Runtime能力,支持細(xì)粒度硬件資源調(diào)度,充分挖掘算力潛力。
在編程體系方面,CANN提供了多樣化的開發(fā)路徑。開發(fā)者既可以使用Ascend C語言和CATLASS模板庫進(jìn)行自定義開發(fā),也可以通過Triton、TileLang等Python前端框架快速驗(yàn)證創(chuàng)意。華為還開放了共享存儲(chǔ)能力,通過SHMEM接口實(shí)現(xiàn)片上內(nèi)存池化,顯著降低通信延遲,代碼量減少60%。下一代產(chǎn)品將引入CCU集合通信加速單元,進(jìn)一步釋放算力潛能。
在計(jì)算標(biāo)準(zhǔn)和工具創(chuàng)新方面,華為推出了HiFloat8低精度數(shù)據(jù)格式,并捐獻(xiàn)給全球計(jì)算聯(lián)盟推動(dòng)標(biāo)準(zhǔn)化。該格式在保持接近FP16精度的同時(shí),大幅降低了顯存占用,為大模型訓(xùn)練和推理提供了更高性價(jià)比的解決方案。工具鏈方面,華為開源了自動(dòng)調(diào)優(yōu)工具msProfiler,可自動(dòng)生成最優(yōu)Tiling策略,使算子開發(fā)效率提升20倍以上。在推理優(yōu)化中,Attention與FFN分離方案通過靈衢互聯(lián)實(shí)現(xiàn)大帶寬低時(shí)延,性能提升超過50%,相關(guān)代碼已開源至vLLM社區(qū)。
全面開源的策略已初步顯現(xiàn)成效。上海人工智能實(shí)驗(yàn)室的研究員基于CANN開源的編譯器組件,開發(fā)了Triton擴(kuò)展深度學(xué)習(xí)編譯器DLCompiler。該編譯器通過跨架構(gòu)DSL擴(kuò)展和智能自動(dòng)優(yōu)化技術(shù),顯著提升了開發(fā)效率和運(yùn)行性能。在MLIR編譯階段,DLCompiler與AscendNPU IR深度對(duì)接,充分利用了底層表達(dá)能力,使Triton算子在昇騰硬件上實(shí)現(xiàn)了高效優(yōu)化。
對(duì)于華為而言,全面開源只是第一步,更重要的是融入全球開發(fā)者生態(tài)。昇騰將優(yōu)先支持Triton、PyTorch等主流開源框架,并第一時(shí)間將最新功能開放給社區(qū)。目前,昇騰主導(dǎo)或深度參與的開源項(xiàng)目超過60個(gè),累計(jì)貢獻(xiàn)37萬行代碼,活躍開發(fā)者數(shù)量超過6500人。CANN技術(shù)指導(dǎo)委員會(huì)的成立,標(biāo)志著昇騰軟件棧的管理從“公司主導(dǎo)”轉(zhuǎn)向“社區(qū)化共治”,開發(fā)者可以通過議題討論、代碼貢獻(xiàn)和規(guī)則制定,成為生態(tài)演進(jìn)的共同塑造者。
在硬件開放方面,華為不僅在軟件層面實(shí)現(xiàn)透明化,還在硬件環(huán)節(jié)徹底打破壁壘,將模組、標(biāo)卡和互聯(lián)協(xié)議開放給合作伙伴。靈衢互聯(lián)協(xié)議的推出,解決了超節(jié)點(diǎn)架構(gòu)中帶寬和時(shí)延的瓶頸問題。該協(xié)議支持資源池化、規(guī)模擴(kuò)展和長穩(wěn)可靠,通過統(tǒng)一協(xié)議和內(nèi)存編址,使有效算力隨集群規(guī)模線性擴(kuò)展,并大幅提升集群可靠性。
硬件能力的釋放正通過行業(yè)解決方案與產(chǎn)業(yè)界共享技術(shù)紅利。華為已聯(lián)合20多家ISV伙伴,基于昇騰平臺(tái)打造行業(yè)解決方案。例如,在金融領(lǐng)域,基于昇騰平臺(tái)的信貸報(bào)告系統(tǒng)顯著提升了處理效率;在醫(yī)療領(lǐng)域,電子病歷和教學(xué)助手的應(yīng)用已進(jìn)入試點(diǎn)階段;在電力行業(yè),算力平臺(tái)支撐了電網(wǎng)調(diào)度優(yōu)化,提升了運(yùn)行穩(wěn)定性。未來,隨著更多伙伴的加入,AI應(yīng)用在千行百業(yè)的滲透將進(jìn)一步加速。
生態(tài)的繁榮離不開人才培養(yǎng)和國際化布局。自2020年起,華為與教育部合作推動(dòng)“智能基座”計(jì)劃,將昇騰課程引入高校課堂,形成覆蓋本科、碩博的培養(yǎng)體系。華為與頭部高校成立鯤鵬昇騰卓越中心和孵化中心,圍繞編譯、算子優(yōu)化和推理加速等方向開展科研課題。例如,北京大學(xué)團(tuán)隊(duì)自研的TileLang編程語言,通過類Python的編程方式大幅降低了AI編程門檻,與昇騰CANN對(duì)接后,實(shí)現(xiàn)了高性能算子開發(fā)。
在國際化方面,華為通過開放代碼、工具鏈和標(biāo)準(zhǔn),將昇騰生態(tài)嵌入國際開源社區(qū),實(shí)現(xiàn)“生態(tài)先行”。昇騰在多個(gè)國際社區(qū)同步發(fā)布新特性,讓海外開發(fā)者第一時(shí)間接觸昇騰能力。同時(shí),華為與海外高校和科研機(jī)構(gòu)建立合作,從聯(lián)合實(shí)驗(yàn)室到人才培養(yǎng)計(jì)劃,逐步構(gòu)建穩(wěn)固的國際化網(wǎng)絡(luò)。這種開放姿態(tài)降低了產(chǎn)業(yè)伙伴的試水成本,使其能夠在已有生態(tài)框架下嘗試使用昇騰,而不必?fù)?dān)心兼容性問題。
從操作系統(tǒng)到自研光器件,再到如今的昇騰生態(tài),華為始終選擇“另辟蹊徑”。通過全面開源、硬件開放、人才培養(yǎng)和全球化布局,昇騰正從單一產(chǎn)品線轉(zhuǎn)變?yōu)殚_發(fā)者、產(chǎn)業(yè)伙伴和科研機(jī)構(gòu)共同參與的開放平臺(tái)。這一轉(zhuǎn)變不僅是中國AI產(chǎn)業(yè)在全球競爭中的突圍,更是對(duì)未來生態(tài)競爭格局的提前布局。