日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

MiniMax深夜發布4560億參數推理模型M1,百萬上下文支持,價格親民

   時間:2025-06-17 14:46:25 來源:ITBEAR編輯:快訊團隊 IP:北京 發表評論無障礙通道

在人工智能領域的一次重大突破中,MiniMax公司于近日震撼發布了全球首個開源大規模混合架構推理模型——MiniMax-M1。這一發布不僅標志著AI技術的新里程碑,還伴隨著一項為期五天的連續更新計劃,引起了業界的廣泛關注。

MiniMax-M1的參數規模達到了驚人的4560億,每個token能激活459億參數,支持長達100萬的上下文輸入,以及業內最長的8萬token推理輸出。這一能力不僅與閉源模型巨頭谷歌Gemini 2.5 Pro持平,更是DeepSeek-R1的8倍之多。為了滿足不同需求,MiniMax還訓練了兩個版本的M1模型,思考預算分別為40K和80K。

在標準基準測試集上的對比結果顯示,MiniMax-M1在復雜的軟件工程、工具使用以及長上下文任務方面,均展現出了優于DeepSeek-R1和Qwen3-235B等開源模型的表現。這一成就不僅得益于其龐大的參數規模,更在于其獨特的混合架構和高效算法。

在M1的研發過程中,MiniMax團隊采用了創新的強化學習方法。據透露,整個強化學習階段使用了512塊H800訓練了三周,租賃成本僅為53.74萬美金(折合人民幣約385.9萬元),遠低于最初的成本預期。這一高效的成本控制策略,無疑為M1的成功發布奠定了堅實基礎。

對于用戶而言,MiniMax-M1提供了極大的便利。在MiniMax APP和Web平臺上,用戶可以不限量免費使用M1。而在API價格方面,MiniMax也提供了多種選擇。對于0-32k的輸入長度,輸入價格為0.8元/百萬token,輸出價格為8元/百萬token;對于32k-128k的輸入長度,輸入價格為1.2元/百萬token,輸出價格為16元/百萬token;對于128k-1M的輸入長度,輸入價格為2.4元/百萬token,輸出價格為24元/百萬token。與DeepSeek-R1相比,M1在第三檔價格上展現出了絕對優勢,因為DeepSeek-R1并不支持如此長的輸入長度。

在評測方面,MiniMax-M1在軟件工程、長上下文和工具使用等方面的表現尤為突出。在OpenAI發布的MRCR測試集中,M1雖然略遜于Gemini 2.5 Pro,但相比其他模型仍具有明顯優勢。在評估軟件工程能力的SWE-bench Verified測試集中,M1的表現也僅次于DeepSeek-R1-0528。特別是在航空業的TAU-bench(airline)測試集中,M1的表現優于所有其他開源和閉源模型。然而,在數學和編程能力方面,M1的得分相對較低,仍有提升空間。

MiniMax-M1的成功發布,不僅展示了MiniMax在AI技術方面的深厚積累,更為整個行業帶來了新的發展機遇。隨著AI技術的不斷進步和應用場景的不斷拓展,MiniMax-M1有望在未來發揮更大的作用,推動人工智能技術的持續創新和發展。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  RSS訂閱  |  開放轉載  |  滾動資訊  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 会泽县| 全椒县| 凤山市| 庆云县| 石河子市| 太谷县| 安丘市| 格尔木市| 澄迈县| 桐柏县| 安康市| 股票| 普洱| 灵台县| 青海省| 西藏| 满城县| 青神县| 南昌县| 华宁县| 苗栗县| 高密市| 晋江市| 贵阳市| 乌恰县| 通河县| 博乐市| 五峰| 图片| 安顺市| 沁水县| 沿河| 鄄城县| 大同市| 东方市| 大理市| 泰顺县| 周至县| 鄂温| 潼关县| 广西|