面壁智能近期震撼發布了其最新的MiniCPM4.0系列模型,這一系列被譽為端側性能與技術創新的新紀元之作,被形象地稱為“最具創意的小鋼炮”。此次發布的兩款核心模型,不僅展現了面壁智能在技術研發上的深厚積累,更為行業樹立了新的標桿。
其中,8B閃電稀疏版憑借其革命性的稀疏架構,實現了前所未有的高效性能。而另一款0.5B輕巧靈動版,雖然體積小巧,卻被贊譽為“最強迷你小鋼炮”,在速度、效能與性能上均有著令人矚目的表現。這兩款模型的問世,標志著面壁智能在端側應用上的又一次重大突破。
在速度方面,MiniCPM4.0系列模型實現了極限情況下高達220倍、常規情況下5倍的速度提升。這一驚人成就得益于系統級稀疏創新的深度優化。通過創新的雙頻換擋技術,模型能夠智能地根據文本長度調整稀疏與稠密注意力機制,從而在處理長文本時更加迅速且高效。相較于同類模型Qwen3-8B,MiniCPM4.0在端側存儲需求上大幅減少,僅需四分之一的緩存空間。
在效能上,MiniCPM4.0系列模型同樣表現出色。它首次實現了全開源的系統級上下文稀疏化高效創新,以極低的5%稀疏度實現了極致的加速效果。同時,結合自研的創新技術,從架構層、系統層、推理層到數據層進行了全面的優化,真正實現了系統級軟硬件稀疏化的高效落地。
性能方面,MiniCPM4.0系列模型延續了其“小身材大能量”的特點。0.5B版本以極低的2.7%訓練開銷,實現了性能翻倍的驚人效果;而8B稀疏版則更是以22%的訓練開銷,超越了Qwen3及Gemma312B等同類模型,進一步鞏固了面壁智能在端側領域的領先地位。
在落地應用方面,MiniCPM4.0系列模型同樣展現出了強大的實力。通過自研的CPM.cu極速端側推理框架,結合多項創新技術,如投機采樣、模型壓縮量化及端側部署框架等,實現了模型體積瘦身90%的同時,速度得到了極大的提升。這為用戶提供了從初體驗到長期使用都無比流暢的體驗。
目前,MiniCPM4.0系列模型已經成功適配了Intel、高通、MTK、華為昇騰等主流芯片,并在多個開源框架上實現了部署。這一系列的創新成果,不僅進一步拓展了MiniCPM4.0的應用潛力,也為行業未來的發展提供了更多的可能性。
想要了解更多關于MiniCPM4.0系列模型的信息,歡迎訪問以下鏈接:
模型合集:https://www.modelscope.cn/collections/MiniCPM-4-ec015560e8c84d
Github:https://github.com/openbmb/minicpm