在圣何塞舉辦的OCP全球峰會(huì)上,英偉達(dá)正式揭曉了其十億瓦級(jí)AI工廠的未來藍(lán)圖,并宣布meta與甲骨文兩大科技巨頭將采用英偉達(dá)Spectrum-X以太網(wǎng)網(wǎng)絡(luò)交換機(jī),以強(qiáng)化其AI數(shù)據(jù)中心網(wǎng)絡(luò),加速大規(guī)模部署進(jìn)程,推動(dòng)AI訓(xùn)練效率實(shí)現(xiàn)質(zhì)的飛躍。
英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛強(qiáng)調(diào),Spectrum-X遠(yuǎn)非簡(jiǎn)單的快速以太網(wǎng)解決方案,而是AI工廠的“神經(jīng)系統(tǒng)”。它使得超大規(guī)模計(jì)算企業(yè)能夠?qū)?shù)百萬(wàn)張GPU無(wú)縫連接,構(gòu)建起一臺(tái)巨型計(jì)算機(jī),從而訓(xùn)練出歷史上最大規(guī)模的AI模型。
作為專為萬(wàn)億參數(shù)模型時(shí)代量身打造的以太網(wǎng)平臺(tái),英偉達(dá)Spectrum-X以太網(wǎng)平臺(tái)由Spectrum-X以太網(wǎng)交換機(jī)與Spectrum-X以太網(wǎng)超級(jí)網(wǎng)卡共同構(gòu)成。這一平臺(tái)是首個(gè)專為AI應(yīng)用設(shè)計(jì)的以太網(wǎng)解決方案,展現(xiàn)了創(chuàng)紀(jì)錄的效率表現(xiàn)。
Spectrum-X以太網(wǎng)的擁塞控制技術(shù)尤為突出,它使得全球最大的AI超級(jí)計(jì)算機(jī)能夠達(dá)到95%的數(shù)據(jù)吞吐量。相比之下,傳統(tǒng)的以太網(wǎng)方案在面對(duì)大規(guī)模數(shù)據(jù)傳輸時(shí),往往會(huì)遭遇數(shù)千次流量沖突,導(dǎo)致吞吐量大幅下降至60%左右。
這一效率的大幅提升,標(biāo)志著AI可擴(kuò)展網(wǎng)絡(luò)在經(jīng)濟(jì)性和性能方面取得了重要突破。英偉達(dá)Spectrum-XGS以太網(wǎng)技術(shù)作為Spectrum-X以太網(wǎng)網(wǎng)絡(luò)平臺(tái)的一部分,具備跨規(guī)模擴(kuò)展的能力,能夠?qū)⒖绯鞘小?guó)家乃至大洲的數(shù)據(jù)中心連接成一個(gè)龐大的十億級(jí)AI超級(jí)工廠。
Spectrum-X以太網(wǎng)平臺(tái)基于英偉達(dá)全棧平臺(tái)構(gòu)建,涵蓋了GPU、CPU、NVLink以及軟件等多個(gè)層面,提供了從計(jì)算到網(wǎng)絡(luò)的無(wú)縫性能保障。其先進(jìn)的擁塞控制、自適應(yīng)路由以及AI驅(qū)動(dòng)的遙測(cè)功能,確保了大規(guī)模AI訓(xùn)練和推理集群的高效運(yùn)行與可預(yù)測(cè)性。
甲骨文公司宣布,將建設(shè)通過Spectrum-X以太網(wǎng)互連的十億級(jí)AI工廠。甲骨文云基礎(chǔ)設(shè)施執(zhí)行副總裁Mahesh Thiagarajan表示:“通過采用Spectrum-X以太網(wǎng),我們能夠以突破性的效率互連數(shù)百萬(wàn)張GPU,從而幫助客戶更快地訓(xùn)練、部署并受益于生成式和推理式AI。”
與此同時(shí),meta公司也宣布將把Spectrum以太網(wǎng)交換機(jī)集成到其Facebook開放交換系統(tǒng)(FBOSS)中。FBOSS是一個(gè)專為大規(guī)模管理和控制網(wǎng)絡(luò)交換機(jī)而開發(fā)的軟件平臺(tái)。此次集成將加速meta的大規(guī)模部署進(jìn)程,提升AI訓(xùn)練效率,并縮短洞察時(shí)間。
meta網(wǎng)絡(luò)工程副總裁Gaya Nagarajan指出:“meta的下一代AI基礎(chǔ)架構(gòu)需要前所未有的開放高效網(wǎng)絡(luò)。通過將英偉達(dá)Spectrum以太網(wǎng)集成到Minipack3N交換機(jī)和FBOSS中,我們能夠擴(kuò)展開放網(wǎng)絡(luò)方法,同時(shí)釋放訓(xùn)練更大規(guī)模模型所需的效率和可預(yù)測(cè)性,將生成式AI應(yīng)用帶給全球數(shù)十億用戶。”
在硬件集成方面,英偉達(dá)NVLink Fusion技術(shù)也取得了顯著進(jìn)展。該技術(shù)使企業(yè)能夠?qū)⑵浒攵ㄖ菩酒瑹o(wú)縫集成到高度優(yōu)化且廣泛部署的數(shù)據(jù)中心架構(gòu)中,從而降低復(fù)雜性并加快產(chǎn)品上市時(shí)間。英特爾和三星代工廠已加入NVLink Fusion生態(tài)系統(tǒng),該生態(tài)系統(tǒng)還包括定制芯片設(shè)計(jì)者、CPU和IP合作伙伴,共同助力AI工廠快速擴(kuò)展,以應(yīng)對(duì)模型訓(xùn)練和Agentic AI推理的苛刻工作負(fù)載。
全新NVLink Fusion生態(tài)伙伴陣容強(qiáng)大,包括CPU合作伙伴富士通、英特爾和高通,定制芯片合作伙伴AIchip、Astera Labs、GUC、Marvell、聯(lián)發(fā)科和三星,以及技術(shù)合作伙伴楷登電子(Cadence)和新思科技(Synopsys)。
作為英偉達(dá)與英特爾合作的一部分,英特爾將構(gòu)建使用NVLink Fusion集成到英偉達(dá)基礎(chǔ)設(shè)施平臺(tái)的x86 CPU。三星代工廠則與英偉達(dá)攜手合作,滿足對(duì)定制CPU和定制XPU日益增長(zhǎng)的需求,為定制芯片提供從設(shè)計(jì)到制造的一站式體驗(yàn)。
如今,十億瓦級(jí)AI集群已成為AI芯片行業(yè)領(lǐng)軍企業(yè)的共同追求。英偉達(dá)Spectrum-X以太網(wǎng)和Spectrum-XGS結(jié)合了OCP的開放性和領(lǐng)先性能,被meta和甲骨文兩大科技巨頭選用部署,將為大規(guī)模AI訓(xùn)練及推理帶來更可觀的效率提升,進(jìn)而加速生成式AI應(yīng)用的開發(fā)與普及。











