滾動資訊

當前位置：首頁 > 資訊 > 信息流 > 正文內容

華為Omni-Infer開源：解鎖超大規模MoE推理高效穩定新方案

時間：2025-07-01 18:25:52 來源：量子位編輯：快訊團隊 IP：北京 發表評論無障礙通道

華為近日宣布了一項重大舉措，針對超大規模MoE（混合專家）模型的推理問題，開源了其名為Omni-Infer的新項目。這一行動無疑為眾多企業用戶和開發者帶來了福音。

Omni-Infer項目包含了推理框架與推理加速套件兩大核心部分。推理框架方面，Omni-Infer與業內的主流開源大模型推理框架如vLLM等實現了完美兼容，這類似于不同品牌的組件能夠無縫集成在同一系統中。同時，Omni-Infer的功能還在不斷拓展，旨在為昇騰硬件平臺上的大模型推理提供更強大的支持。

值得注意的是，Omni-Infer與vLLM、SGLang等主流框架是解耦的，用戶可以獨立安裝，這大大降低了軟件版本維護的成本。用戶只需關注vLLM等框架的主版本，即可享受Omni-Infer帶來的便利。

而Omni-Infer的推理加速套件則更像是一位企業級的“智能調度員”。它擁有智能調度系統，能夠合理安排任務，支持大規模分布式部署，確保任務處理的低延遲和高效率。同時，它還是一個精準的“負載平衡器”，針對不同長度的任務序列，在預填充和解碼階段都做了優化，以實現最大吞吐量和低延遲。

對于MoE模型來說，Omni-Infer更是其“專屬搭檔”。它支持多種配置，如EP144/EP288等，讓混合專家模型能夠高效協作。Omni-Infer還具備分層非均勻冗余和近實時動態專家放置功能，智能地分配資源，確保資源的充分利用。

為了讓AI推理更快更穩，Omni-Infer還專門為LLM、MLLM和MoE等模型優化了注意力機制。這一優化讓模型在處理信息時更加聚焦和高效，提升了性能和可擴展性。

體驗Omni-Infer也并不復雜。首先，它目前僅支持CloudMatrix384推理卡和特定版本的Linux操作系統。安裝方面，用戶可以通過Docker鏡像方式進行安裝，只需運行一條命令即可獲取預先集成所需的CANN及Torch-NPU依賴包，同時內置可直接運行的Omni-Infer與vLLM工具包。

以PD分離自動化部署為例，用戶只需按照文檔教程，通過少量代碼和步驟即可完成安裝和部署。整個過程簡單快捷，讓AI推理變得更加高效。

除了技術上的開源，華為還為Omni-Infer建立了專業的開源社區。社區倉庫中包含了社區治理、會議、活動、生態合作、代碼規范、設計文檔等全面信息，讓開發者能夠深入參與到社區發展中。同時，Omni-Infer社區采用了開放的治理機制，提供公正透明的討論與決策環境。

Omni-Infer社區采取了“主動適配”的生態合作模式，積極擁抱國內正在成長的人工智能開源項目，實現生態的多方共贏。作為與業界主流開源基金會保持緊密合作關系的社區團隊，Omni-infer的首個活動就將參與OpenInfra基金會在蘇州的Meetup，為開發者提供了交流與學習的機會。

對于感興趣的開發者和小伙伴來說，Omni-Infer的技術報告、可分析代碼包以及更多相關信息已經全面開放，大家可以自行獲取并參與到這一開源項目中來。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

AI時代，PC應用開發王者歸來，開發者新機遇何在？

07-01

假扮AI的17歲男高中生，用回復治愈了整個B站

07-01

中東“后廠村”崛起

07-01

全球首款量產自驅動露營拖車Pebble Flow開啟交付

07-01

馬斯克Robotaxi新夢想四部曲

07-01

這屆高考生在線下買手機：不喜尬吹，不追品牌

07-01

河南：購買鴻蒙車機系統及途靈平臺新能源車，補貼3000元/臺

07-01

蔚來李斌：神璣NX9031達到設計目標

07-01

波音高管人事調整：韋斯特轉任CEO顧問，馬萊夫接任CFO

07-01

淘寶/天貓上線商家版自助服務大廳

07-01

最新！格力集團迎來新掌舵人：鄒暉出任董事長

07-01

紫光國芯推出自研PSRAM芯片，最高128Mb容量

07-01

馬斯克：特斯拉Robotaxi將逐漸減少安全監督員

07-01

馬斯克又拿到錢了：旗下xAI獲100億美元巨額融資

07-01

日本企業與早稻田大學合作開發純本土國產人形機器人

07-01

點擊查看更多 +

全站最新

寧德時代與問界汽車攜手，高端電池產線在超級工廠正式投產

上汽通用五菱新能源上半年銷量飆升，連續6月增速超五成

智能化浪潮下，汽車懸架系統零部件行業迎來新發展機遇

昂科威家族6月熱銷1.4萬輛，昂科威Plus持續領跑燃油SUV市場

零跑汽車6月交付量再創新高，穩居新勢力銷量榜首

建平青年職工“會聚良緣”，浪漫交友聯誼覓良伴

熱門內容

本欄最新

華為Omni-Infer開源：解鎖超大規模MoE推理高效穩定新方案

AI時代，PC應用開發王者歸來，開發者新機遇何在？

假扮AI的17歲男高中生，用回復治愈了整個B站

中東“后廠村”崛起

全球首款量產自驅動露營拖車Pebble Flow開啟交付

馬斯克Robotaxi新夢想四部曲

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

華為Omni-Infer開源：解鎖超大規模MoE推理高效穩定新方案

日本精品一区二区三区高清久久