近日,英偉達(NVIDIA)的掌舵人黃仁勛與一家備受矚目的中國AI初創企業——MiniMax(希宇科技)的創始人閆俊杰進行了一場長達兩小時的私密會晤。據悉,閆俊杰是唯一獲此殊榮的中國AI創業公司創始人,與黃仁勛共同探討了中美AI行業的現狀與未來趨勢。
MiniMax由閆俊杰于2021年創立,他此前曾任商湯科技的高管職位。這家新興企業在AI領域迅速嶄露頭角,特別是在大規模混合架構推理模型方面取得了顯著成就。
今年6月,MiniMax震撼發布了全球首個開源的大規模混合架構推理模型M1。該模型不僅在性能上超越了國內的閉源模型,逼近了DeepSeek R1及海外頂尖模型的水平,更以卓越的效率和高性價比贏得了業界的廣泛關注。
MiniMax的M1模型得益于其獨創的Lightning Attention機制,這一機制在計算注意力矩陣時表現出色,大幅提升了訓練和推理效率。因此,M1模型在處理長上下文輸入和深度推理任務時具有顯著優勢,支持業內最高的100萬上下文輸入,以及長達8萬Token的推理輸出。
在算力使用方面,M1模型同樣表現出色。在進行8萬Token深度推理時,其算力需求僅為DeepSeek R1的約30%。這一特性使得MiniMax在訓練和推理階段都擁有巨大的算力效率優勢。
MiniMax還提出了創新的強化學習算法CISPO,通過裁剪重要性采樣權重來提升學習效率。在AIME實驗中,CISPO的收斂性能顯著優于包括字節近期提出的DAPO在內的多種強化學習算法,甚至超越了DeepSeek早期使用的GRPO。
得益于這些技術創新,MiniMax的強化訓練過程異常高效,遠遠超出了預期。整個強化學習階段僅使用了512塊H800 GPU,耗時三周,租賃成本僅為53.47萬美金,比最初預算少了一個數量級。
在業內主流的17個評測集上,MiniMax對M1進行了詳細評測。結果顯示,M1在長上下文理解任務中表現出色,僅以微弱差距落后于Google的Gemini 2.5 Pro,但在代理工具使用場景(TAU-bench)中卻戰勝了后者。
鑒于M1模型的高效訓練和推理算力使用,MiniMax宣布在MiniMax APP和Web平臺上提供不限量免費使用服務。同時,公司還以業內最低價格在官網上提供API服務,價格根據輸入長度的不同而有所差異,但均比DeepSeek-R1更具性價比。