在近期舉辦的年度云計(jì)算盛會(huì)上,亞馬遜云計(jì)算部門AWS推出新一代人工智能訓(xùn)練芯片Trainium 3,并預(yù)告下一代產(chǎn)品Trainium 4的開發(fā)計(jì)劃。這一舉措被視為對(duì)英偉達(dá)和谷歌在AI芯片市場(chǎng)主導(dǎo)地位的有力挑戰(zhàn),同時(shí)伴隨多款新模型和AI服務(wù)的發(fā)布,亞馬遜試圖在激烈的競(jìng)爭(zhēng)中擴(kuò)大市場(chǎng)份額。
Trainium 3芯片的部署速度超出行業(yè)預(yù)期。亞馬遜在發(fā)布前一代加速器僅約一年后便推出這款新品,與英偉達(dá)承諾的年度更新節(jié)奏相當(dāng)。目前,該芯片已在至少數(shù)個(gè)數(shù)據(jù)中心完成部署,并從發(fā)布會(huì)當(dāng)天起向客戶開放使用。AWS副總裁Dave Brown透露,明年初將啟動(dòng)大規(guī)模擴(kuò)張計(jì)劃,進(jìn)一步強(qiáng)化市場(chǎng)滲透。
性能方面,Trainium 3實(shí)現(xiàn)顯著突破。作為首款采用3納米制程的AWS AI芯片,其專為智能體、推理和視頻生成等應(yīng)用優(yōu)化。搭載該芯片的Trn3 UltraServer系統(tǒng)在訓(xùn)練和推理性能上較第二代提升超4倍,內(nèi)存容量增加4倍。單顆芯片提供2.52千萬(wàn)億次浮點(diǎn)運(yùn)算能力,內(nèi)存帶寬達(dá)4.9TB/s。單臺(tái)完整配置的服務(wù)器可容納144顆芯片,總算力達(dá)362 PFLOPs,內(nèi)存容量高達(dá)20.7TB。能效表現(xiàn)同樣亮眼,較前代提升40%,性能功耗比提高4倍。
價(jià)格優(yōu)勢(shì)成為亞馬遜的核心賣點(diǎn)。公司宣稱,Trainium芯片能以低于英偉達(dá)GPU的成本提供更高效的計(jì)算支持。Brown強(qiáng)調(diào),該產(chǎn)品在價(jià)格性能比方面具有顯著競(jìng)爭(zhēng)力。這一策略已吸引部分客戶轉(zhuǎn)向亞馬遜平臺(tái),例如AI初創(chuàng)公司Anthropic計(jì)劃年底前在其數(shù)據(jù)中心部署100萬(wàn)顆Trainium芯片。
下一代產(chǎn)品Trainium 4的預(yù)告引發(fā)關(guān)注。這款芯片將支持英偉達(dá)的NVLink Fusion高速互聯(lián)技術(shù),意味著AWS系統(tǒng)可與英偉達(dá)GPU互操作并擴(kuò)展性能。這一技術(shù)兼容性或降低大型AI應(yīng)用遷移至亞馬遜平臺(tái)的技術(shù)門檻,尤其考慮到英偉達(dá)CUDA架構(gòu)在主流AI應(yīng)用中的廣泛采用。不過,亞馬遜尚未公布具體發(fā)布時(shí)間表,外界預(yù)計(jì)明年大會(huì)將披露更多細(xì)節(jié)。
盡管硬件性能強(qiáng)勁,亞馬遜仍面臨軟件生態(tài)挑戰(zhàn)。與英偉達(dá)豐富的深度學(xué)習(xí)庫(kù)相比,AWS芯片的配套工具鏈尚不成熟。部分客戶反饋,在構(gòu)建復(fù)雜模型時(shí)仍依賴英偉達(dá)平臺(tái)。為縮小差距,AWS推出Neuron SDK并強(qiáng)化PyTorch原生集成,承諾開發(fā)者無需修改代碼即可完成模型訓(xùn)練和部署。目前,除Anthropic外,日本LLM Karakuri、Splashmusic等公司已采用第三代Trainium芯片,并報(bào)告推理成本顯著降低。
伴隨芯片發(fā)布,亞馬遜同步推出四款Nova 2系列模型。Nova 2 Lite定位經(jīng)濟(jì)型推理模型,支持多模態(tài)輸入輸出,在多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)于或持平競(jìng)爭(zhēng)對(duì)手;Nova 2 Pro作為高端推理模型,擅長(zhǎng)代理編碼和長(zhǎng)期規(guī)劃等復(fù)雜任務(wù);Nova 2 Sonic實(shí)現(xiàn)語(yǔ)音與文本的統(tǒng)一處理,支持實(shí)時(shí)對(duì)話式AI;Nova 2 Omni則是首款多模態(tài)統(tǒng)一模型,可同時(shí)分析文本、圖像、視頻和語(yǔ)音數(shù)據(jù)。這些模型均強(qiáng)調(diào)價(jià)格性能比優(yōu)勢(shì),試圖在細(xì)分市場(chǎng)建立差異化競(jìng)爭(zhēng)力。
服務(wù)創(chuàng)新方面,AWS推出“開放式訓(xùn)練”平臺(tái)Nova Forge。該服務(wù)允許企業(yè)基于預(yù)訓(xùn)練模型構(gòu)建定制版本,并提供訓(xùn)練數(shù)據(jù)混合、強(qiáng)化學(xué)習(xí)環(huán)境配置和安全控制工具。Reddit已利用該服務(wù)整合內(nèi)容審核系統(tǒng),Booking.com等公司則通過其構(gòu)建專屬模型。另一項(xiàng)新服務(wù)Nova Act聚焦瀏覽器任務(wù)自動(dòng)化,由定制版Nova 2 Lite模型驅(qū)動(dòng),在早期客戶中實(shí)現(xiàn)90%的任務(wù)可靠性,顯著提升工作流程效率。例如,1Password通過該服務(wù)簡(jiǎn)化用戶登錄流程,Hertz則加速軟件測(cè)試周期,將原本數(shù)周的工作縮短至數(shù)小時(shí)。
市場(chǎng)反應(yīng)方面,亞馬遜股價(jià)在消息公布后逼近239美元,日內(nèi)漲幅擴(kuò)大至近2.2%。相比之下,英偉達(dá)股價(jià)漲幅收窄至0.9%,AMD則下跌近2.1%。這一波動(dòng)反映投資者對(duì)亞馬遜AI戰(zhàn)略的重新評(píng)估,但長(zhǎng)期競(jìng)爭(zhēng)格局仍取決于技術(shù)落地效果和客戶采納速度。











