北京時間周三凌晨,全球云計(jì)算“一哥”亞馬遜AWS在Re:Invent大會期間宣布,華爾街翹首期待的新一代自研AI芯片Trainium3正式公開上市。
綜合公司介紹,Trainium3是亞馬遜首款3nm制程芯片。與上一代Trainium芯片相比,Trainium3計(jì)算性能最高提升4.4倍,能效提升4倍,內(nèi)存帶寬幾乎提升4倍,主打AI算力競爭的性價比賽道。由Trainium3組成的UltraServer系統(tǒng)還可以互聯(lián),每臺可容納144枚芯片,為單個應(yīng)用提供多達(dá)100萬枚Trainium3芯片,為上一代的10倍。
公司表示,與同樣使用圖形處理單元(GPU)的系統(tǒng)相比,訓(xùn)練和運(yùn)行AI模型的成本能夠降低最多50%。
當(dāng)然,指望亞馬遜Trainium3與谷歌TPU一戰(zhàn),甚至“挑戰(zhàn)英偉達(dá)”的投資者可能會有些失望,畢竟沒有任何資料顯示這款芯片除了“性價比”之外的其他優(yōu)勢。
亞馬遜拒絕透露新款A(yù)I芯片與谷歌、英偉達(dá)最新產(chǎn)品的基準(zhǔn)性能對比,也未披露功耗參數(shù)。目前我們僅知道每枚芯片集成144GB的高帶寬內(nèi)存,而谷歌最新的Ironwood TPU為192GB,英偉達(dá)的Blackwell GB300則最高可達(dá)288GB。
負(fù)責(zé)Trainium項(xiàng)目的AWS副總裁兼首席架構(gòu)師Ron Diamant也直言:“我不認(rèn)為我們會試圖取代英偉達(dá)”。
Diamant進(jìn)一步表示,歸根結(jié)底,這款自研芯片最大的優(yōu)勢就是性價比。他的主要目標(biāo)是為客戶在不同的計(jì)算工作負(fù)載上提供更多選擇。
對于亞馬遜的AI芯片而言,最大的短板并不是芯片本身,而是亞馬遜缺乏足夠有深度且易于使用的軟件庫。
除了亞馬遜自己以及公司大力投資的AI初創(chuàng)企業(yè)Anthropic外,現(xiàn)在幾乎找不到使用Trainium芯片的知名公司。
而Anthropic也在10月表示,將采購最多100萬塊谷歌的TPU,又在11月宣布與英偉達(dá)簽署投資入股協(xié)議,并將進(jìn)一步購買英偉達(dá)芯片的算力。不過Anthropic也強(qiáng)調(diào),亞馬遜仍然是其“主要的訓(xùn)練合作伙伴和云服務(wù)提供商”, 預(yù)計(jì)到年底將使用超過一百萬顆Trainium 2芯片。
使用人工智能賦能施工設(shè)備自動化的Bedrock Robotics介紹稱,公司基礎(chǔ)設(shè)施運(yùn)行在AWS服務(wù)器上,但在為挖掘機(jī)構(gòu)建引導(dǎo)模型時,就得用英偉達(dá)芯片。公司首席技術(shù)官Kevin Peterson總結(jié)稱:“我們需要它既高性能又易于使用,那就是英偉達(dá)。”
亞馬遜似乎也意識到了這個問題。在Trainium3的公告中,公司特別強(qiáng)調(diào)Trainium4已在研發(fā)中,最大的亮點(diǎn)是“能與英偉達(dá)芯片協(xié)同工作”。
公司表示,Trainium4將支持英偉達(dá)NVLink Fusion高速芯片互連技術(shù),最終形成一種兼顧GPU與Trainium服務(wù)器的經(jīng)濟(jì)高效機(jī)架級AI基礎(chǔ)設(shè)施。
英偉達(dá)介紹稱,NVLink Fusion的核心是NVLink Fusion chiplet,超大規(guī)模云服務(wù)商可以將該chiplet嵌入其定制ASIC設(shè)計(jì)中,以連接NVLink規(guī)模化互聯(lián)和NVLink交換機(jī)。
(NVLink Fusion芯片組使72個定制ASIC以每個ASIC 3.6 TB/s的帶寬實(shí)現(xiàn)全互聯(lián),來源:英偉達(dá))







