日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

小米發布MiMo開源大模型,7B參數展現卓越推理力超越競品

   時間:2025-04-30 15:31:44 來源:ITBEAR編輯:快訊團隊 發表評論無障礙通道

小米大模型團隊近日通過其官方公眾號“Xiaomi MiMo”宣布了一項重要決定:正式開源專為推理任務定制的大模型——Xiaomi MiMo。這款模型在多項公開測評中,如數學推理和代碼競賽,均展現出了卓越的性能,尤其值得注意的是,它僅以7B參數就超越了OpenAI的o1-mini(閉源)以及阿里Qwen的QwQ-32B-Preview(開源),后者規模更為龐大。

MiMo之所以能在推理能力上取得如此顯著的成就,關鍵在于其在預訓練和后訓練階段所采取的創新策略。在預訓練階段,團隊精心挑選并合成了大量富含推理信息的語料,總量達到了約200B tokens。通過分三個階段逐步提升訓練難度,MiMo累計接受了25T tokens的訓練,這一過程極大地豐富了模型對推理模式的認知,為其強大的推理能力奠定了堅實的基礎。

在后訓練階段,MiMo團隊更是引入了高效且穩定的強化學習算法和框架,以進一步提升模型的推理性能。他們創造性地提出了Test Difficulty Driven Reward(測試難度驅動獎勵)機制,這一機制有效地緩解了困難算法問題中獎勵稀疏的難題。同時,他們還引入了Easy Data Re-Sampling(簡單數據重采樣)策略,以確保強化學習(RL)訓練過程的穩定性。

為了進一步提高訓練效率,MiMo團隊還設計并實現了Seamless Rollout(無縫展開)系統。這一系統使得RL訓練的速度提升了2.29倍,驗證速度也提高了1.96倍,從而大大縮短了模型的開發周期。

Xiaomi MiMo的開源,無疑為推理任務的大模型研究注入了新的活力。它以其卓越的性能和創新的技術,為行業樹立了新的標桿,也為廣大開發者提供了寶貴的學習和研究資源。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  RSS訂閱  |  開放轉載  |  滾動資訊  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 阳原县| 微博| 古蔺县| 阜阳市| 铜山县| 寻乌县| 双鸭山市| 建德市| 涿鹿县| 盱眙县| 建昌县| 海伦市| 安宁市| 湖口县| 湖南省| 神农架林区| 仙游县| 宾阳县| 台安县| 黎城县| 图木舒克市| 林州市| 洪洞县| 谢通门县| 南乐县| 达拉特旗| 民权县| 四会市| 宁城县| 睢宁县| 苗栗市| 河南省| 萝北县| 尼木县| 西华县| 台北县| 铅山县| 老河口市| 卢龙县| 汉沽区| 元阳县|