日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

英偉達4B小模型擊敗GPT-5 Pro!成本僅1/36

   時間:2025-12-08 15:56:09 來源:量子位編輯:快訊 IP:北京 發表評論無障礙通道
 

英偉達小模型持續獲勝。

ARC-AGI 2最新成績,4B小模型NVARC以27.64%的公開榜成績力壓GPT-5 Pro 18.3%登頂榜首。

且每任務成本僅20美分,大約是GPT-5 Pro單任務成本(超過7美元)的1/36。

據官方分析,此次NVARC奪冠的亮點在于零預訓練深度學習方法,沒有依賴大規模通用數據集進行前期預訓練,規避了預訓練模型的領域偏見、數據依賴等問題。

而ARC-AGI 2確實是一個消除了與公共訓練數據重疊的更高難度測試,主要是看測試模型能否高效地獲取超出其訓練數據的新技能。

成績出爐后,官方訪談到了NVARC團隊的Jean-Francois Puget和Ivan Sorokin,進行技術剖析。

快來看看“性價比之王”是如何“練”成的?

不靠參數堆料

英偉達的策略是將復雜推理移至離線的合成數據管道,訓練能在評估時快速運行的較小模型。

簡單來說就是大規模合成高質量數據,然后對現有模型進行優化,并且將昂貴的計算工作轉移到離線進行。

由于Kaggle比賽對計算資源限制非常嚴格,團隊意識到,他們不能直接使用那些需要超強算力的大型LMM來進行復雜的、一步一步的推理和代碼生成。

因此他們改變了思路,決定將最燒錢的計算工作轉移到離線完成。比如利用GPT-OSS-120B來大規模制作高質量的合成謎題。

團隊從H-ARC、BARC數據集中搜集了現有的ARC謎題數據,然后將簡單的謎題混合起來,生成更復雜的新謎題。

為了確保數據質量,他們將復雜的推理管線拆分成不同的階段,每個階段都可以獨立驗證。

通過這種方式,他們建立了一個含320萬+增強樣本的合成數據集,其中每個樣本最多有7對輸入/輸出。

這里忍不住提一嘴,哈薩比斯剛強調了Scaling Law的重要性,那么合成數據的Scaling怎么不算呢(doge)?

言歸正傳,NVARC核心的推理模塊以改進版ARChitects方法為基礎,選用小參數模型Qwen3-4B,通過對話式模板簡化謎題理解。

訓練時借助NeMo RL框架和Megatron后端進行監督微調。

不過,讓模型取得優異成績的關鍵一步在于測試時微調(TTFT)。

針對ARC-AGI-2“每個任務都是全新規則”的特點,NVARC引入了LoRA微調技術,并且是針對每一個問題都進行微調,讓模型在做題前快速適應。

而對ARChitects方法的改進在于解碼階段DFS算法做了批處理優化,修復結果非確定性問題。

同時統一了8種數據增強操作評估候選解,最終在公開榜獲得了27.64%的分數。

在競賽后期,團隊還應用了“少即是多”的TRM方法,嘗試與Qwen3-4B集成補充分數,雖然有一定提升,但受各種限制并沒有大幅優化。

那么問題來了,有人會說這樣訓練出來的小模型不就是做題機器嗎?哪里比得上全面發力的超級大模型?

但更值得關注的或許不在于模型本身,而在于實現突破的方法。

在特定領域任務中,小模型經過針對性優化,性能并不遜色,再加之成本、速度、適配性與領域聚焦優勢,它們已經在諸多場景嶄露頭角。

將正確的方法用在正確的地方,將會實現更大的價值。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
日本精品一区二区三区高清 久久
亚洲尤物视频在线| 男男视频亚洲欧美| 91精品婷婷国产综合久久性色 | 视频一区免费在线观看| 精品国产免费一区二区三区四区 | 亚洲成人精品在线观看| 久久在线免费观看| 欧美午夜视频网站| 粉嫩高潮美女一区二区三区| 三级久久三级久久久| 国产欧美一区二区精品久导航 | 无吗不卡中文字幕| 中文字幕精品一区二区三区精品| 91精品国产综合久久精品图片 | 亚洲精品视频一区| 久久久精品蜜桃| 91精品国产欧美日韩| 色综合久久综合网欧美综合网| 国模少妇一区二区三区| 偷窥少妇高潮呻吟av久久免费| 中文字幕制服丝袜成人av| 精品欧美一区二区在线观看| 欧美三区免费完整视频在线观看| 成人av午夜影院| 国产精品99久久不卡二区| 奇米精品一区二区三区在线观看一| 亚洲免费资源在线播放| 中文成人av在线| 国产欧美一区二区精品性色超碰 | 亚洲电影中文字幕在线观看| 亚洲国产成人自拍| 久久蜜桃av一区二区天堂| 3d动漫精品啪啪| 欧美区一区二区三区| 欧美性猛交xxxx乱大交退制版 | 中文字幕日韩av资源站| 久久久久国产精品厨房| 欧美精品一区二区久久久| 欧美一级xxx| 制服丝袜亚洲网站| 91精品国模一区二区三区| 欧美久久久久免费| 717成人午夜免费福利电影| 欧美人妖巨大在线| 欧美三级中文字幕| 欧美色网站导航| 欧美中文字幕一区| 欧洲另类一二三四区| 欧美美女黄视频| 欧美一区二区日韩| 日韩欧美国产一区在线观看| 日韩欧美一区中文| wwwwww.欧美系列| 国产日本欧洲亚洲| 国产精品久久久久久久裸模| 国产精品进线69影院| 一区二区三区资源| 亚洲五月六月丁香激情| 奇米色一区二区三区四区| 丝袜美腿一区二区三区| 蜜臀va亚洲va欧美va天堂| 蜜臀99久久精品久久久久久软件| 久久国产尿小便嘘嘘尿| 国产精品一卡二| 99久久精品免费看| 欧美日韩亚洲不卡| 日韩精品一区二区三区在线观看| 久久久一区二区三区捆绑**| 国产精品伦一区二区三级视频| 日韩理论片在线| 亚洲一区二区三区精品在线| 日产精品久久久久久久性色| 韩国精品一区二区| 91视频免费观看| 欧美高清你懂得| 国产亚洲精品bt天堂精选| ㊣最新国产の精品bt伙计久久| 亚洲伊人色欲综合网| 精品一区二区免费在线观看| 不卡视频一二三四| 欧美一区二区三区在线视频| 久久精品亚洲精品国产欧美| 亚洲在线视频网站| 国产乱人伦偷精品视频免下载| 99久久婷婷国产| 91精品久久久久久久99蜜桃| 国产精品视频线看| 视频一区二区国产| 成人一区二区在线观看| 精品视频在线免费看| 国产亚洲综合在线| 亚洲成人午夜电影| 国产成人午夜片在线观看高清观看| 日本久久一区二区| 久久久99免费| 亚洲超丰满肉感bbw| 成人一区二区三区在线观看| 欧美日韩在线三级| 国产精品丝袜黑色高跟| 麻豆成人在线观看| 在线视频观看一区| 亚洲国产精品t66y| 精品中文字幕一区二区| 色呦呦网站一区| 国产无遮挡一区二区三区毛片日本 | 欧美日韩精品一区二区| 欧美国产日韩精品免费观看| 亚欧色一区w666天堂| 成人av在线播放网站| 欧美一级二级三级乱码| 亚洲韩国一区二区三区| av在线播放不卡| 国产亚洲欧美中文| 琪琪一区二区三区| 欧美视频在线观看一区二区| 国产精品二三区| 国产美女精品在线| 精品精品欲导航| 午夜欧美在线一二页| 色一情一伦一子一伦一区| 欧美韩国日本不卡| 国内外精品视频| 精品成人免费观看| 日韩av一级片| 欧美蜜桃一区二区三区| 亚洲精品va在线观看| 99精品1区2区| 亚洲欧洲日本在线| 成人精品在线视频观看| 久久精品人人爽人人爽| 国产一区二区久久| 2014亚洲片线观看视频免费| 麻豆国产精品视频| 精品国产免费久久| 精品亚洲porn| 久久综合丝袜日本网| 激情文学综合网| 久久综合九色综合欧美就去吻 | 99久久99久久精品国产片果冻| 亚洲精品在线免费播放| 国产一区二区三区蝌蚪| 久久亚洲一级片| 国产白丝网站精品污在线入口| 久久久久久毛片| 高清免费成人av| 国产精品欧美一级免费| 99久久免费视频.com| 亚洲视频在线一区| 欧美亚洲一区三区| 日韩av午夜在线观看| 91麻豆精品国产91久久久久| 奇米一区二区三区av| 欧美精品一区二区三区在线播放| 久久99久久精品| 国产三级欧美三级日产三级99| 国产aⅴ精品一区二区三区色成熟| 国产拍揄自揄精品视频麻豆| 成人成人成人在线视频| 日韩久久一区二区| 欧美高清你懂得| 国产精品一区久久久久| 国产欧美综合在线| 91国产丝袜在线播放| 日韩影院免费视频| 久久婷婷色综合| 99在线精品视频| 亚洲图片一区二区| 精品第一国产综合精品aⅴ| 国产成人综合视频| 一区二区免费视频| 欧美一区二视频| 激情五月激情综合网| 中文字幕制服丝袜一区二区三区| 欧美午夜精品一区二区三区| 免费成人在线影院| 国产日韩成人精品| 欧美日韩一区视频| 国产麻豆精品在线观看| 亚洲人精品午夜| 884aa四虎影成人精品一区| 国产精品18久久久久久久久久久久| 亚洲欧洲精品一区二区三区不卡| 欧美日韩在线三区| 国产美女在线观看一区| 亚洲综合久久久| 26uuu国产电影一区二区| 色视频欧美一区二区三区| 老司机午夜精品| 亚洲女爱视频在线| 欧美大片国产精品| 色婷婷精品久久二区二区蜜臀av| 免费成人在线播放| 中文字幕中文字幕在线一区| 日韩一区二区三区观看| 91免费视频大全| 国模套图日韩精品一区二区| 一区二区三区四区不卡在线 | 亚洲伦在线观看| 精品国产91九色蝌蚪| 欧美视频完全免费看|