MiniMax公司近期震撼發布其劃時代的新模型——MiniMax-M1,這款模型以其開源特性及大規模混合架構,在復雜生產力場景中大放異彩,樹立了開源模型的新標桿。MiniMax-M1不僅在國內超越了眾多閉源模型,其性能更是逼近國際頂尖水平,同時保持了業界無與倫比的性價比優勢。
尤為引人注目的是,MiniMax-M1能夠處理高達100萬的上下文輸入,這一能力與海外頂級閉源模型Google Gemini2.5Pro比肩,相較于DeepSeek R1,更是實現了8倍的提升。該模型還能輸出長達8萬Token的推理結果,這得益于MiniMax獨創的混合架構,特別是其核心的閃電注意力機制,使得在處理超長上下文和深度推理任務時,效率實現了質的飛躍。例如,在深度推理8萬Token的任務中,MiniMax-M1的算力需求僅為DeepSeek R1的30%,展現了顯著的算力效率。
在強化學習領域,MiniMax同樣取得了突破,提出了全新的CISPO算法。該算法通過優化重要性采樣權重,極大地提升了強化學習的訓練效率。在AIME實驗中,CISPO算法的收斂速度較其他算法,包括字節最新提出的DAPO,快了一倍,甚至超越了DeepSeek早期采用的GRPO算法。這些技術創新使得MiniMax-M1的強化訓練過程異常高效,訓練成本大幅降低,僅用了512塊H800三周的時間,租賃成本遠低于預期。
在評測表現上,MiniMax-M1同樣不負眾望,在業內主流的17個評測集中均取得了優異成績。特別是在軟件工程、長上下文理解與工具使用等復雜生產力場景中,MiniMax-M1展現出了壓倒性的優勢。在SWE-bench基準測試中,MiniMax-M1-40k和MiniMax-M1-80k分別取得了55.6%和56.0%的高分,雖然略低于DeepSeek-R1-0528的57.6%,但遠超其他開源模型。憑借百萬級的上下文窗口,MiniMax-M1在長上下文理解任務中更是獨領風騷,不僅超越了所有開源模型,還在某些方面逼近了OpenAI o3和Claude4Opus,位列全球第二。
在代理工具使用場景(TAU-bench)中,MiniMax-M1同樣表現出色,不僅領跑所有開源模型,還成功擊敗了Gemini-2.5Pro。MiniMax-M1-80k在多數基準測試中的表現均優于MiniMax-M1-40k,這充分證明了增加計算資源對于提升模型性能的有效性。
價格方面,MiniMax-M1繼續保持親民路線,成為業內價格最低的模型之一。用戶可以在MiniMax APP和Web上不限量免費使用該模型,同時,官網也提供了極具競爭力的API服務價格。這一舉措無疑將進一步推動MiniMax-M1的市場普及和應用拓展。
感興趣的用戶可以通過以下鏈接獲取MiniMax-M1的模型資源:MiniMax-M1-40k位于huggingface.co/MiniMaxAI/MiniMax-M1-40k,而MiniMax-M1-80k則位于huggingface.co/MiniMaxAI/MiniMax-M1-80k。