英偉達(dá)近日正式推出開源模型系列Nemotron 3,包含Nano、Super和Ultra三種規(guī)格,旨在為AI智能體應(yīng)用提供兼具高精度與高效能的解決方案。該系列通過引入創(chuàng)新的混合潛在專家(MoE)架構(gòu),支持開發(fā)者構(gòu)建大規(guī)模、可靠的多智能體系統(tǒng),應(yīng)對(duì)復(fù)雜場(chǎng)景下的技術(shù)挑戰(zhàn)。
隨著企業(yè)從單一模型聊天機(jī)器人向協(xié)作式多智能體AI系統(tǒng)轉(zhuǎn)型,開發(fā)者面臨通信效率、上下文一致性及推理成本等多重難題。Nemotron 3系列通過優(yōu)化架構(gòu)設(shè)計(jì),直接回應(yīng)這些痛點(diǎn),提供透明度與開放性,助力企業(yè)實(shí)現(xiàn)工作流程自動(dòng)化。目前,安永、思科、Oracle Cloud Infrastructure、西門子等十余家行業(yè)領(lǐng)軍企業(yè)已將其納入AI開發(fā)流程,覆蓋制造、網(wǎng)絡(luò)安全、軟件開發(fā)等領(lǐng)域。
該系列包含三款差異化模型:Nemotron 3 Nano為300億參數(shù)的小型模型,每次激活參數(shù)不超過30億,專為高針對(duì)性任務(wù)設(shè)計(jì),如軟件調(diào)試、內(nèi)容摘要及低推理成本的信息檢索;Super版本擁有約1000億參數(shù),每個(gè)token最多激活100億參數(shù),適用于多智能體協(xié)作場(chǎng)景;Ultra版本則擴(kuò)展至5000億參數(shù),每token活躍參數(shù)達(dá)500億,可支撐復(fù)雜AI應(yīng)用需求。
Nemotron 3 Nano在計(jì)算成本效率方面表現(xiàn)突出,其性能較前代提升顯著:token處理吞吐量提高4倍,推理token生成成本降低60%,同時(shí)配備100萬token的上下文窗口,能更精準(zhǔn)地處理長(zhǎng)流程、多步驟任務(wù)。該模型已上線開源平臺(tái)Hugging Face,開發(fā)者可自由調(diào)用;Super與Ultra版本預(yù)計(jì)于2026年上半年陸續(xù)發(fā)布。
對(duì)于初創(chuàng)企業(yè)而言,Nemotron 3的開源特性降低了AI智能體開發(fā)門檻,加速?gòu)脑驮O(shè)計(jì)到企業(yè)級(jí)部署的迭代周期。其模塊化架構(gòu)允許開發(fā)者根據(jù)需求靈活組合功能,在控制成本的同時(shí)實(shí)現(xiàn)定制化解決方案。











