小米近日正式宣布開源其自研的Xiaomi MiMo-V2-Flash模型,這一消息在科技領域引發廣泛關注。該模型是小米為追求極致推理效率而專門研發的混合專家(MoE)架構模型,總參數規模達309B,激活參數為15B。通過引入創新的Hybrid注意力架構以及多層MTP推理加速技術,該模型在多個智能體測評基準中表現優異,成功躋身全球開源模型前兩名。
在性能對比方面,Xiaomi MiMo-V2-Flash展現出顯著優勢。其代碼生成能力可與行業標桿閉源模型Claude 4.5 Sonnet相媲美,但推理成本僅為后者的2.5%,同時生成速度提升至兩倍。這種高性價比的表現,使其在開源模型領域形成獨特競爭力。據技術團隊介紹,該模型在保持高性能的同時,通過架構優化實現了資源利用的最大化。
在2025小米“人車家全生態”合作伙伴大會上,Xiaomi MiMo大模型負責人羅福莉詳細闡述了模型的技術突破。她指出,MiMo-V2-Flash在多數評測基準上已超越DeepSeek V3.2和K2-Thinking等知名模型,且參數量較這些模型減少二分之一至三分之二。在速度與成本的平衡方面,該模型在全球頂尖模型中處于領先位置,初步具備模擬現實世界的能力,為智能終端的應用拓展提供了新的可能性。
羅福莉進一步分享了對下一代智能體系統的展望。她認為,未來的智能體不應局限于語言模擬,而應成為真正理解人類世界并與之共存的存在。在執行能力上,智能體需要從單純回答問題轉向完成任務,具備記憶、推理、自主規劃、決策和執行等綜合能力。從感知層面看,統一多模態感知是關鍵,這能為理解物理世界奠定基礎,使智能體更好地融入眼鏡等可穿戴設備,推動人機交互方式的革新。










