阿里巴巴近期震撼發布并宣布開源其新一代通義千問模型Qwen3,這一創新之舉不僅在參數量上實現了顯著縮減,僅為DeepSeek-R1的三分之一,更在成本控制上取得了突破性進展。更令人矚目的是,Qwen3在性能上全面超越了DeepSeek-R1、OpenAI-o1等全球頂尖模型,一舉奪得全球最強開源模型的桂冠。
就在Qwen3發布的同一天,摩爾線程傳來喜訊,宣布其已率先完成了對Qwen3全系列模型在其全功能GPU上的高效支持。這一成就不僅彰顯了摩爾線程在技術創新方面的雄厚實力,也進一步驗證了其MUSA架構和全功能GPU的技術成熟度和可靠性。
目前,主流推理引擎均能夠基于摩爾線程的MUSA平臺順利運行Qwen3系列模型。MUSA平臺以其強大的后端支持能力,為vLLM、Ollama、GPU Stack等各類主流開源推理引擎提供了高效運行Qwen3系列模型的堅實基礎。
以QWen3-235B-A22B為例,這是Qwen3系列中參數量最大的模型,它能夠在摩爾線程的全功能GPU上,基于vLLM-MUSA引擎實現穩定運行。這一實踐不僅證明了Qwen3模型的強大性能,也展示了摩爾線程GPU在支持大規模語言模型方面的卓越能力。
此次阿里巴巴開源的Qwen3模型家族成員豐富,包括兩款MoE模型——Qwen3-235B-A22B和Qwen3-30B-A3B,以及六個Dense模型,分別是Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。這些模型的開源,無疑將為全球開發者提供更多選擇和可能性。
摩爾線程的此次成功實踐,不僅是對Qwen3模型性能的有力證明,也是對其自身技術實力的一次全面展示。隨著Qwen3模型的廣泛應用和摩爾線程GPU技術的不斷進步,我們有理由相信,未來將有更多創新性的應用和技術成果涌現,為人工智能領域的發展注入新的活力。