在近日舉辦的一場(chǎng)全球科技盛會(huì)上,亞馬遜宣布推出其第二代自研大模型家族Nova2,包含四款全新產(chǎn)品:面向輕量級(jí)應(yīng)用的多模態(tài)模型Lite、專注復(fù)雜推理的代理模型Pro、語(yǔ)音交互模型Sonic,以及支持75萬(wàn)字上下文處理的Omni。這一系列模型以“行業(yè)領(lǐng)先性價(jià)比”為核心賣點(diǎn),其中Lite模型的定價(jià)尤為引人注目——每百萬(wàn)token輸入僅需0.045美元,輸出0.09美元,成本約為同類競(jìng)品的50%。AWS首席執(zhí)行官M(fèi)att Garman強(qiáng)調(diào),Nova2的優(yōu)化重點(diǎn)在于“成本效率而非參數(shù)規(guī)模”,通過(guò)多模態(tài)能力、代碼生成和代理任務(wù)優(yōu)化,為用戶提供更具競(jìng)爭(zhēng)力的解決方案。
與模型發(fā)布同步推出的“Nova Forge”服務(wù)成為開(kāi)發(fā)者關(guān)注的焦點(diǎn)。這項(xiàng)年費(fèi)10萬(wàn)美元的服務(wù)允許客戶深度參與模型訓(xùn)練過(guò)程,從預(yù)訓(xùn)練、中期優(yōu)化到后期微調(diào)的任一階段注入私有數(shù)據(jù),構(gòu)建專屬定制化模型。Garman比喻稱,這一模式類似于“從零開(kāi)始學(xué)習(xí)語(yǔ)言”,而非直接對(duì)成品模型進(jìn)行表面調(diào)整,從而避免因過(guò)早微調(diào)導(dǎo)致的推理能力衰減。據(jù)披露,亞馬遜內(nèi)部電商團(tuán)隊(duì)和Alexa語(yǔ)音助手已率先應(yīng)用Forge構(gòu)建業(yè)務(wù)模型,外部客戶Reddit則利用該服務(wù)訓(xùn)練內(nèi)容審核系統(tǒng),官方稱其性能在內(nèi)部評(píng)測(cè)中超越市面主流商用模型。若需亞馬遜工程師全程技術(shù)支持,客戶需額外支付咨詢費(fèi)用。
技術(shù)層面,Nova2系列展現(xiàn)了亞馬遜在模型架構(gòu)上的創(chuàng)新。例如,Omni模型通過(guò)擴(kuò)展上下文窗口至75萬(wàn)字,顯著提升了長(zhǎng)文本處理能力;Sonic模型則強(qiáng)化了語(yǔ)音交互的自然度與實(shí)時(shí)響應(yīng)速度。Matt Garman透露,AWS團(tuán)隊(duì)在訓(xùn)練過(guò)程中采用了動(dòng)態(tài)數(shù)據(jù)分配技術(shù),根據(jù)任務(wù)復(fù)雜度自動(dòng)調(diào)整計(jì)算資源,進(jìn)一步壓縮了成本。亞馬遜通用人工智能首席科學(xué)家Rohit Prasad表示,F(xiàn)orge服務(wù)的推出將企業(yè)自建模型的成本從“數(shù)億至數(shù)十億美元”級(jí)壓縮至百萬(wàn)美元量級(jí),“以1%的預(yù)算實(shí)現(xiàn)90%的性能”,這一模式有望重塑行業(yè)生態(tài)。
商業(yè)合作方面,亞馬遜宣布與谷歌云達(dá)成互聯(lián)協(xié)議,允許客戶跨平臺(tái)調(diào)用Gemini等競(jìng)爭(zhēng)對(duì)手的模型。這一舉措被解讀為亞馬遜構(gòu)建開(kāi)放生態(tài)的重要一步,用戶可根據(jù)需求靈活組合不同廠商的模型服務(wù)。據(jù)AWS披露,F(xiàn)orge服務(wù)預(yù)計(jì)于2026年一季度在北美和歐洲部分地區(qū)開(kāi)啟預(yù)覽,首批開(kāi)放領(lǐng)域?qū)⒕劢菇鹑凇⑨t(yī)療和電商等數(shù)據(jù)敏感型行業(yè)。業(yè)內(nèi)分析認(rèn)為,亞馬遜通過(guò)“低價(jià)模型+定制化服務(wù)”的組合策略,正試圖在生成式AI市場(chǎng)占據(jù)更有利的位置,尤其是針對(duì)企業(yè)級(jí)客戶的長(zhǎng)尾需求。













