小米公司近日正式推出開源MoE大模型Xiaomi MiMo-V2-Flash,該模型總參數量達3090億,激活參數量150億,憑借卓越的推理效率在智能體AI領域引發關注。據官方披露,模型通過Hybrid注意力架構創新與三層MTP推理加速技術,在多個Agent測評基準中躋身全球開源模型前二,代碼能力比肩閉源標桿模型Claude 4.5 Sonnet,同時將推理成本壓縮至其2.5%,生成速度提升兩倍。
技術架構方面,Xiaomi MiMo-V2-Flash采用1:5配比的Global Attention與Sliding Window Attention混合結構,窗口大小設定為128,原生支持32K上下文長度并可擴展至256K訓練。模型負責人羅福莉在2025小米人車家全生態合作伙伴大會上透露,團隊通過三層MTP推理加速實現并行Token驗證,使推理速度提升2至2.6倍,這種設計使其在代碼生成、復雜任務拆解等場景中表現突出。
實際應用層面,該模型已初步展現模擬物理世界的能力。測試案例顯示,其可通過HTML代碼編寫簡易操作系統,模擬太陽系運行軌跡,甚至生成具有交互功能的圣誕樹動畫。這些能力得益于模型對多模態數據的深度理解,使其在智能體任務中能更精準地模擬人類操作邏輯。
為降低使用門檻,小米同步推出在線AI聊天服務Xiaomi MiMO Studio,用戶可在平臺體驗模型深度思考與聯網搜索功能。該服務支持多輪對話中的上下文理解,能根據用戶需求自動調用工具鏈完成復雜任務,例如同時處理文檔分析、數據可視化與報告生成等跨領域需求。
團隊背景方面,模型負責人羅福莉擁有北京師范大學計算機本科與北京大學計算語言學碩士學位,曾主導阿里巴巴多語言預訓練模型VECO開發,并推動AliceMind開源項目。2022年加入DeepSeek期間,她參與研發的MoE大模型DeepSeek-V2引發行業關注。去年底,這位技術專家以千萬年薪加盟小米的消息曾登上熱搜,其朋友圈官宣文案"智能終將從語言邁向物理世界"引發技術圈熱議。
在合作伙伴大會上,羅福莉進一步闡釋技術愿景:"下一代智能體不應局限于語言模擬,而需構建真正理解物理世界規則、能與環境動態交互的系統。"這一理念與小米"人車家全生態"戰略形成呼應,暗示模型未來可能深度融入智能家居、自動駕駛等場景,推動AI從輔助工具向主動參與者轉型。










