日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

英偉達發布OpenReasoning-Nemotron套件:輕量級推理模型助力科研探索

   時間:2025-07-20 20:27:16 來源:ITBEAR編輯:快訊團隊 IP:北京 發表評論無障礙通道
 

英偉達近日宣布了一項重大進展,推出了其全新的推理模型套件——OpenReasoning-Nemotron。這一套件內嵌了四個精心構建的模型,它們均基于Qwen-2.5進行微調,參數規模覆蓋1.5B至32B不等,源頭直指擁有6710億參數的龐然大物——DeepSeek R1 0528大模型。通過“蒸餾”技術,英偉達成功實現了大模型的輕量化,使得這些推理模型能夠在標準游戲電腦上流暢運行,極大地降低了部署門檻,繞開了高昂的GPU與云計算成本。

OpenReasoning-Nemotron的核心競爭力并不在于訓練技術的突破性創新,而是源于其背后強大的數據支撐。英偉達利用NeMo Skills精心打造了500萬個涵蓋數學、科學與編程領域的解答數據集,通過純監督學習的方式對模型進行微調。經過嚴格測試,32B模型在數學競賽AIME24中斬獲89.2分,在HMMT 2月賽中亦獲得73.8分,即便是參數最少的1.5B模型,也分別取得了55.5分和31.5分的佳績,充分展現了其卓越的推理與解題能力。

英偉達將OpenReasoning-Nemotron定位為科研探索的強大助力,四個模型的完整檢查點將在Hugging Face平臺開放下載,為研究人員提供了強化學習等進一步實驗的堅實基礎,同時也便于他們針對特定任務進行定制優化。該模型還支持“GenSelect模式”,即針對每個問題生成多種解答版本,通過篩選最優解來進一步提升準確率。在這一模式下,32B模型在多項數學與編程基準測試中,表現甚至超越了OpenAI的o3-high水平。

尤為英偉達在訓練這些模型時,全程未引入強化學習,僅采用監督微調的方式,為社區提供了一個干凈且技術前沿的起點,為未來的強化學習相關研究開辟了廣闊空間。對于擁有高性能游戲GPU的玩家及個人開發者而言,這套模型無疑是一個巨大的福音,使他們能夠在本地運行接近業界最先進水平的推理模型,極大地推動了推理技術的發展與普及。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  開放轉載  |  滾動資訊  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 凤阳县| 辽阳市| 封丘县| 安康市| 瑞金市| 邮箱| 南丹县| 乳源| 水城县| 禄劝| 台江县| 油尖旺区| 大连市| 色达县| 乾安县| 水城县| 大同县| 夏邑县| 南宫市| 松滋市| 曲松县| 科技| 闽侯县| 石首市| 富裕县| 建德市| 永嘉县| 和林格尔县| 临武县| 大安市| 紫云| 荣成市| 正阳县| 东光县| 湖南省| 正宁县| 铜川市| 财经| 喜德县| 杂多县| 米脂县|