滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

面壁智能MiniCPM4：端側模型極限提速，8B性能超12B競品引關注

時間：2025-06-07 21:23:28 來源：ITBEAR編輯：快訊團隊 IP：北京 發表評論無障礙通道

在近期舉辦的2025智源大會上，面壁智能這家北京的大模型創新企業，推出了其開源模型MiniCPM 4.0的兩個新版本，分別為0.5B和8B，內部代號“前進四”。這一發布引起了業內廣泛關注。

據悉，MiniCPM4-0.5B的訓練成本僅為Qwen3-0.6B的2.7%，卻以一半的參數量實現了性能翻倍，綜合得分平均分高達52.06分，遠超同類模型。更為出色的是，面壁智能還推出了一個0.5B的三級量化版本，平均得分更是達到了56分，這一成績實屬不易。

而MiniCPM4-8B的表現同樣令人矚目。其訓練開銷僅為22%，并加入了長上下文稀疏化版本，使得同等參數下性能更強。在同類端側模型排行榜中，MiniCPM4-8B的綜合得分甚至超越了Gemma3-12B，與Qwen3-8B比肩，位居榜首。

面壁智能CEO李大海在會上表示，MiniCPM4模型的最大特點就是速度快。在處理極端場景下的140K上下文時，需要極大的端側內存。而在Jetson Orin AGX（64G）或RTX 4090（24G）硬件上運行128K長文本時，像Qwen3-8B這樣未進行上下文稀疏化的模型，顯存往往不夠用，需要借助CPU內存，這會導致速度急劇下降。而MiniCPM4-8B則通過快速稀疏化工作，將占用的低長文本緩存降至1/4，在常規場景中至少可以取得3-5倍的速度優勢。

李大海進一步透露，在顯存受限的極限場景中，MiniCPM4的測試數據甚至可以達到220倍的速度提升。面壁智能的MiniCPM4-MCP模型在端側利用MCP協議，支持15個主流應用，綜合評測表現得分頗高。而另一個MiniCPM4-Survey端側版則可在AI PC上構建深度研究服務，成為離線可用的隨身研究報告工具，有助于保護本地隱私數據。

值得注意的是，面壁智能與英特爾緊密合作，首次在端側解鎖了128K長上下文窗口。在英特爾平臺上，基于InfLLM 2.0稀疏注意力結構，實現了3.8倍加速的推理優化效果。同時，MiniCPM4已經可以在華為昇騰、聯發科、高通等主流芯片上流暢運行，并支持vLLM、AutoGPT等推理框架，歐拉版也正在積極適配中。

那么，面壁智能是如何實現MiniCPM4又快又好的表現的呢？李大海分享了背后的技術細節。他提到，這是行業首個全開源系統級上下級稀疏化高效創新。MiniCPM4采用了InfLLM 2.0混合稀疏注意力結構，通過分塊分區域處理文本，只對最具相關性的重點區域進行注意力計算，從而大大提高了效率。同時，面壁智能還創新地采用了高效的自動雙頻換擋技術，長文本用稀疏方案，短文本用稠密方案，進一步提升了性能。

在推理方面，面壁智能自研了全套端側高性能推理框架，包括實現稀疏、投機和量化的高效結合的CPM.cu，極致低位寬量化的BitCPM，以及面向多平臺端側芯片極致優化的Arkinfer。這些創新使得MiniCPM4在端側的表現更加出色。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

巨頭聯手！哈啰、螞蟻、寧德時代共鑄自動駕駛新篇章

06-23

網易有道“子曰3”數學模型：低成本高效能，開啟數學教育新篇章！

06-23

周鴻祎論AI：人工智能非人類替代品，助力超級個體成長是關鍵

06-23

知識產權平臺架構：如何打造高效、安全的技術基石？

企業在設計架構時，需遵循高并發、易擴展、強安全原則，合理選擇技術，加強安全防護。系統架構還應預留出 AI分析接口，以便在功能擴展中能夠輕松地集成人工智能技術，從而提升系統的智能化水平和應用范圍。在數據庫設…

06-23

華為HDC：為“走得慢的人”鋪就數字世界的無障礙之路

視障用戶殷楠，從出生起就生活在「看不見」的世界里，他卻能熟練運用科技突破壁壘。杜鵬是北京冬奧會和冬殘奧會的特聘無障礙體驗員，在輪椅上度過了23 年，他就解答了這個「盲點」：于輪椅用戶而言，運動不是興趣，…

06-23

字節跳動美食AI“探飯”內測，豆包大模型助力本地生活服務升級

近期，媒體界傳來消息，字節跳動旗下的用戶增長團隊悄然推出了一款名為“探飯”的AI創新產品，該產品依托字節跳動強大的技術后盾——豆包大模型，并由其全資子公司北京有竹居網絡技術有限公司精心打造。“探飯”的定位頗為獨特，旨在為用戶提供全方位的美食智能向導服務

06-23

銀河通用獲寧德時代超10億融資

在2023年的資本市場上，智能機器人領域的銀河通用公司成為了一顆耀眼的新星，成功募集超過10億元資金，刷新了具身智能行業單筆融資的紀錄。此次融資由電池巨頭寧德時代攜手溥泉資本共同主導，同時吸引了包括國開科創、北京機器人產業基金、紀源資本在內的多家投資機構積極參與，更有若干早期投資者選擇追加投資。

06-23

AI賦能熱門IP，Labubu動態壁紙如何成賺錢新招？

06-23

蘋果或加速布局AI，正探討收購初創公司Perplexity？

06-23

火山引擎新推AI域名推薦，讓企業輕松找到心儀網址！

06-23

AI自保泄露機密？Anthropic揭示大模型自主性風險隱患

在針對 Anthropic、OpenAI、谷歌、Meta、xAI 等 16 家主流 AI 廠商的模型進行多場景模擬測試時，研究人員發現它們存在普遍的目標偏離行為：為了實現既定目標，那些通常拒絕有害指令的模型會…

06-23

智慧照明新突破！蘇州城投照明榮獲阿拉丁神燈獎“數智應用獎”

近年來，公司聚焦數字經濟時代照明行業創新應用，以深化新一代信息技術與智慧照明融合發展為主線，秉持“綠色發展、融合發展、數字發展”三大原則，全面啟動數字化基礎設施完善工程、數字化服務能力提升工程、數字化轉型創新…

06-23

蘋果AI落后，Siri乏力，能否靠收購Thinking Machines Lab逆襲？

蘋果為了終結在AI領域的困局，或將迎來史上最大一筆收購。在9to5Mac上，Zac Hall認為在現代AI經驗上，蘋果內部沒有誰比得上Mira Murati：這位OpenAI前首席技術官理應是蘋果AI的未來…

06-23

哈啰攜手螞蟻、寧德時代，超30億資金加碼Robotaxi賽道！

造父智能科技有限公司的股權結構清晰明了，由螞蟻集團旗下的上海云玚企業管理咨詢有限公司、哈啰旗下的上海鈞哈網絡科技有限公司，以及寧德時代旗下的寧波梅山保稅港區問鼎投資有限公司共同持股。據悉，三方首期投資總額已超過30億元，展現出對自動駕駛未來的堅定信心。

06-23

哈啰正式進軍Robotaxi，攜手螞蟻寧德時代，融資超30億布局自動駕駛

06-23

點擊查看更多 +

全站最新

00后創業新秀打造21自由度靈巧手，靈初智能能否成為機器人界Model 3？

Perplexity瀏覽器Windows版來襲，搜索智能體能否挑戰谷歌地位？

華為云生態共舞：根深葉茂，共創數智化未來新篇章

自適應機器人獨角獸非夕科技，億級融資加速具身智能產業布局

大模型六小虎競賽，誰將成AI創業上市新貴？

筷子科技Kuaizi獲近億元B輪融資，加速全球化布局與內容商業AI創新

熱門內容

本欄最新

知識產權平臺架構：如何打造高效、安全的技術基石？

華為HDC：為“走得慢的人”鋪就數字世界的無障礙之路

AI自保泄露機密？Anthropic揭示大模型自主性風險隱患

智慧照明新突破！蘇州城投照明榮獲阿拉丁神燈獎“數智應用獎”

蘋果AI落后，Siri乏力，能否靠收購Thinking Machines Lab逆襲？

哈啰攜手螞蟻、寧德時代，超30億資金加碼Robotaxi賽道！

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

面壁智能MiniCPM4：端側模型極限提速，8B性能超12B競品引關注

日本精品一区二区三区高清久久