12月20日消息,摩爾線程華山GPU芯片正式發(fā)布,首發(fā)采用“花港”新架構(gòu)。
定位AI訓(xùn)推一體、超智融合,同時(shí)配套發(fā)布超十萬(wàn)卡級(jí)AI工廠技術(shù)與新一代高性能張量計(jì)算系統(tǒng)。
華山以“花港”架構(gòu)為基礎(chǔ),聚焦AI訓(xùn)練與推理場(chǎng)景的一體化能力,在系統(tǒng)級(jí)支撐技術(shù)方面,配備超十萬(wàn)卡級(jí)AI工廠技術(shù)。
新一代Scale-up系統(tǒng):搭載MTLink 4.0+多種類以太協(xié)議,片間互聯(lián)速度達(dá)134.5Gb/s,支持?jǐn)U展至1024 GPUs規(guī)模,適配多種Scale-up,支持SHARP技術(shù);
RAS 2.0:新增SRAM奇偶校驗(yàn)及ECC能力,強(qiáng)化錯(cuò)誤檢測(cè)、上報(bào)與隔離功能,同時(shí)全面提升debuggability能力;
ACE2.0新一代異步通信引擎:通過(guò)架構(gòu)優(yōu)化實(shí)現(xiàn)更高效的通信調(diào)度,支撐大規(guī)模集群的協(xié)同運(yùn)算。
采用新一代高性能張量計(jì)算系統(tǒng),全精度MMA:支持TF32/FP16等;實(shí)現(xiàn)端到端加速的混合低精度計(jì)算,適配大語(yǔ)言模型等AI場(chǎng)景需求。
性能指標(biāo)方面,“華山”GPU在浮點(diǎn)算力、訪存帶寬、訪存容量、高速互聯(lián)帶寬等性能上大幅超過(guò)英偉達(dá)hopper,部分性能媲美甚至超越英偉達(dá)Blackwell架構(gòu)產(chǎn)品,進(jìn)一步強(qiáng)化了在AI大模型訓(xùn)推場(chǎng)景的技術(shù)競(jìng)爭(zhēng)力。









