在12月18日舉辦的小米人車家全生態大會上,新加入的“天才少女”羅福莉攜團隊推出MiMo-V2-Flash模型,成為全場焦點。這款參數規模達309B、激活參數15B的模型,雖被羅福莉戲稱“小到不愿稱其為大模型”,卻憑借高性價比與快速推理能力引發行業關注。

小米團隊明確將該模型定位為Agent基座,核心優化方向聚焦三大領域:強化代碼與工具調用能力以提升智能體交互效率;通過混合注意力機制突破推理速度瓶頸;探索后訓練范式以激發強化學習潛能。官方數據顯示,MiMo-V2-Flash在SWE-Bench Multilingual測試中超越GPT-5等閉源模型,代碼能力躋身全球開源模型前列。更引人注目的是其成本優勢——推理價格僅為Claude Sonnet 4.5的2.5%,生成速度卻達2倍,API定價輸入0.7元/百萬tokens、輸出2.1元/百萬tokens,形成顯著市場競爭力。
技術架構層面,小米采用5:1比例的滑動窗口注意力(SWA)與全局注意力(GA)混合結構。實驗表明,SWA在長文本處理與推理任務中表現優于主流線性注意力機制,且固定KV Cache設計便于適配現有基礎設施。不過團隊也坦言,300B規模距離端側落地仍有差距,未來需進一步壓縮模型體積。
羅福莉在演講中提出更具野心的愿景:“AI進化需構建與真實環境交互的物理模型,打造具備時空連貫性的虛擬宇宙。”這一表述暗合小米雙線并進的戰略布局:一方面持續死磕端側部署,通過升級“超級小愛”與澎湃OS,推動智能終端從指令執行向主動服務轉型;另一方面加速智駕領域突破,以大模型為基座拓展自動駕駛能力邊界。

回顧2025年,小米在AI領域呈現加速奔跑態勢:4月開源MiMo-7B系列,5月突破多模態視覺理解,11月整合自動駕駛與機器人技術推出具身智能大模型,12月以MiMo-V2-Flash完成年度收官。這一連串動作背后是巨額投入——集團總裁盧偉冰透露,2025年研發投入將超300億元,其中四分之一直投AI領域,未來五年計劃投入超2000億元。組織架構上,小米已搭建自主AI Infra平臺,并秘密組建6500張GPU的萬卡集群,為大規模模型訓練提供算力支撐。
人才戰略同樣關鍵。除羅福莉領銜基礎模型研發外,小米還引入陳龍團隊攻克智駕難題。雙方協作成果顯著:陳龍團隊提出的跨具身基座模型MiMo-Embodied,成功打通自動駕駛與機器人操作的知識遷移通道。這一突破意味著小米正嘗試用統一AI邏輯驅動手機、智能家居、智能汽車等全生態硬件,形成技術協同效應。
市場分析認為,小米的AI戰略正從技術儲備轉向生態落地。其全球超10億臺設備連接量構成獨特優勢,但挑戰同樣嚴峻:如何讓模型在多樣終端上保持穩定性能,如何將技術突破轉化為用戶可感知的體驗提升,將成為決定這場進化能否成功的關鍵因素。

















