在AI界的風云變幻中,一款備受矚目的新模型終于在4月29日凌晨揭開了神秘面紗。Qwen 3,這款號稱全面超越DeepSeek R1的開源AI大模型,一經發布便引發了業界的廣泛討論。
近幾個月來,網絡上關于DeepSeek R2的傳言此起彼伏,有消息稱其將于5月份發布。而Qwen 3選擇在這個時間點亮相,無疑是想搶占市場先機。杭州一家中廠的算法從業者透露,Qwen 3的發布策略顯然是為了避免與DeepSeek R2正面交鋒。
國產大模型開放平臺的一位工作人員劉露則表示,他們團隊在Qwen 3發布前不到12小時才得知消息,并連夜完成了該系列模型在平臺的部署上線。這一速度體現了業界對Qwen 3的高度關注和快速響應。
Qwen 3的發布,標志著開源AI大模型的技術能力再次取得了突破。作為國內首個混合推理模型,Qwen 3不僅支持思考模式和非思考模式兩種運行方式,還在性能及成本優化方面展現出了驚人的表現。
據悉,Qwen 3系列開源了8個模型,包括2個MoE(混合專家)大模型和6個Dense(稠密)大模型。其中,MoE模型通過混合多個專家網絡,實現了對不同任務的分類處理和高效解決。這種架構的優勢在于能夠節省計算成本,提高性價比。
在性能方面,Qwen 3旗艦模型Qwen3-235B-A22B在代碼、數學、通用能力等基準測試中,均展現出了優于DeepSeek-R1等頂級模型的表現。而小型MoE模型Qwen3-30B-A3B也表現不俗,與GPT 4o、谷歌Gemma3-27B-1T等模型相比同樣具有競爭力。
Qwen 3還支持119種語言和方言,并優化了Agent和代碼能力,加強了對MCP的支持。這些特性使得Qwen 3在應用場景上更加廣泛和靈活。
自DeepSeek R1發布以來,開源大模型市場一直保持著激烈的競爭態勢。科大訊飛、百度、OpenAI、阿里、字節等玩家紛紛推出自己的推理模型,但均未能撼動DeepSeek R1的地位。然而,隨著Qwen 3的發布,這一格局或將發生改變。
阿里在開源自研模型方面一直走在前列,Qwen系列產品已在多個開源榜單中排名靠前。據全球最大的AI開源社區Huggingface顯示,Qwen的兩款模型在audio-text-to-text任務類目下熱度居前。同時,基于Qwen系列的衍生模型數量也已超過9萬個,成為全球最大的AI模型家族之一。
然而,盡管Qwen系列在生態活躍度和性能指標方面取得了顯著成績,但在下載量方面仍與meta旗下的Llama系列存在差距。不過,隨著Qwen 3的發布,這一差距有望逐漸縮小。
Qwen 3的發布不僅為阿里增添了新的競爭力,也為整個開源大模型市場帶來了新的變數。在接下來的競爭中,DeepSeek R2的亮相無疑將為市場增添更多的不確定性。然而,無論結果如何,開源市場的競爭都將持續進行,誰能成為最終的贏家仍充滿未知。
值得欣慰的是,在當前的市場格局中,國產玩家Qwen仍保持著領先地位。這不僅體現了中國在AI領域的快速發展和創新能力,也為全球AI產業的發展注入了新的活力和動力。