文|劉俊宏
編|王一粟
在AI大模型走向應用的時代,AI“賣鏟人”英偉達又帶來了最新的“參考答案”。
12月15日,英偉達正式發布了Nemotron 3系列開放AI模型。該模型系列包含Nano、Super和Ultra三種規模,模型主打效率和領先的精度,適用于AI Agent的應用開發。
對于這套模型,英偉達創始人兼首席執行官黃仁勛總結說:“開放創新是AI進步的基礎。通過Nemotron,我們將先進AI轉化成開放平臺,為開發者提供構建大規模代理式系統所需的透明度與效率。”
本次發布的三個規模的模型,英偉達的設計目標非常明確,直指AI應用中的高效和節能。
Nemotron 3 Nano模型目前已經上線。該模型參數總量為300億,由于模型采用了獨特的異構MoE架構,這使得每次運行時只需激活30億參數。模型能按需使用,非常省電。相比上一代模型,Nemotron 3 Nano速度快4倍,成本低60%,非常適合寫代碼、總結文檔、當智能助手等日常任務。模型還支持100萬token的上下文記憶能力。這相當于記住幾本書的內容,保證模型在使用中不會輕易忘事。
Nemotron 3 Super模型,預計于2026上半年推出,主打多智能體協作完成任務。該模型參數總量約1000億,每個token最多激活100億參數,也是兼具了節能和高效。
Nemotron 3 Ultra模型,同樣預計于2026上半年推出。主要面對高級推理引擎,服務于需要深度研究和策略規劃的AI工作流,是Nemotron 3系列的“最強大腦”。該模型參數約5000億,每個token最多激活500億參數,適用于復雜的AI應用。
值得注意的是,Nemotron 3 Super與Ultra采用基于NVIDIA Blackwell架構的4位NVFP4訓練格式,可顯著降低顯存需求并加速訓練進程。這種效率使更大規模模型能在現有基礎設施上進行訓練,不會因更高精度格式而犧牲準確性。
簡單來說,是就是之前訓練一個大模型需要最新、最好的GPU集群才能兼顧準確性和效率。現在開發者可以在現有硬件上訓練,不需要擔心低精度會讓AI“變傻”的問題。
英偉達推出Nemotron 3系列模型的想法,是想讓開發者能根據特定工作負載選擇更合適自己的開放模型。AI任務能在數十至數百個智能體間靈活擴展,同時在復雜工作流中獲得更快速、精準的長時推理能力。
簡單來說,就是英偉達為AI開發者提供了一套AI“積木”。應對一項“大工程”,開發者可以按需選擇有小磚(Nano快)、中磚(Super穩)和大磚(Ultra強)。或者同時招募幾十上百個“工人”(智能體)一起干活。
為了更方便開發者使用,本次英偉達在開源了模型之余,還開放了訓練數據集和前沿強化學習庫。
為了給開發者示范高性能特定領域智能體如何創建推理、編碼及多步驟的工作流,英偉達本次公開了3 萬億token規模的全新Nemotron預訓練、后訓練及強化學習數據集。Nemotron Agentic Safety Dataset工具提供真實場景的遙測數據,幫助團隊評估并提升復雜智能體系統的安全性。
為了加速AI開發進程,英偉達發布了NeMo Gym與NeMo RL開源庫。這能為Nemotron 模型提供訓練環境及后訓練基礎。在驗證模型安全性和性能環節,英偉達還推出了NeMo evaluator。目前這些工具,都已經在GitHub和Hugging Face平臺上線。
開發工具層面,Nemotron 3 已獲得LM Studio 、llama.cpp、SGLang 和vLLM支持。Prime Intellect與Unsloth正將NeMo Gym的即用型訓練環境直接集成至其工作流,使團隊能夠更加快速、便捷地獲得強大的強化學習訓練能力。
為了方便Nemotron 3模型落地,AI云廠商們也做好了相應的準備。
總體來看,Nemotron 3 是英偉達想讓AI被更多人使用的一次努力。作為算力供應商的英偉達,依然是為開發者降低AI門檻,做開源生態的姿態。畢竟,只有AI開發者能一起賺錢,英偉達的GPU才能賣得更多。











