在本周的科技界,阿里巴巴通義團隊以一連串震撼發布,強勢登頂Github開源榜單,掀起了一場AI技術的風暴。
從7月22日至25日,通義團隊連續推出了四款重量級產品,分別是Qwen3-235B非思考版本、Qwen3-Coder編程模型、Qwen3-235B-A22B-Thinking-2507推理模型,以及WebSailor AI Agent框架。這四款產品分別覆蓋了基礎模型、編程模型、推理模型和智能體領域,均迅速攀升至各自領域的開源榜單前列。
權威機構Artificial Analysis對通義團隊的最新成果給予了高度評價,認為通義千問3已成為全球最智能的非思考基礎模型。非思考模式下的Qwen3-235B模型,在多項關鍵測試中表現卓越,不僅超越了眾多頂級開源模型,甚至領先某些頂級閉源模型。
尤其Qwen3模型在Agent能力上展現出非凡實力,在BFCL測評中表現突出,這標志著模型在理解復雜指令、自主規劃、調用工具完成任務的能力上達到了新高度。Agent能力被視為未來AI應用的核心競爭力,通義團隊的這一突破無疑為AI技術的發展開辟了新的道路。
7月23日發布的Qwen3-Coder編程模型,更是在全球開發者社區引發了轟動。這款基于MoE架構的編程模型,擁有480B總參數和35B激活參數,原生支持256K上下文,可擴展至1M。在開發者最為關注的SWE-bench Verified基準測試中,Qwen3-Coder取得了開源模型的最佳表現,展現了強大的編程能力。
科技界領袖紛紛為Qwen3-Coder點贊,Perplexity CEO Aravind Srinivas稱贊其成果令人驚嘆,開源正在獲勝。推特創始人Jack Dorsey也表示,Qwen3與Goose搭配使用效果極佳,進一步證明了Qwen3-Coder的強大實力。
與此同時,阿里通義實驗室還開源了WebSailor AI Agent框架,直接對標OpenAI的Deep Research產品。這款框架在BrowseComp-en/zh測試中性能顯著優于所有開源智能體,可媲美專屬閉源模型。WebSailor采用復雜任務生成和強化學習模塊的雙重技術架構,能夠在海量信息中進行高效檢索和推理,打破了閉源系統在信息檢索領域的壟斷地位。
最后,7月25日發布的Qwen3-235B-A22B-Thinking-2507推理模型,成為本周發布的重磅壓軸產品。該模型在AIME25、LiveCodeBench v6、WritingBench和PolyMATH等多項基準測試中均取得了優異成績,展現了強大的推理能力。OpenRouter數據顯示,阿里千問的API調用量在過去幾天暴漲,已超過1000億tokens,進一步證明了市場對阿里開源模型的認可度。
全球網友對通義團隊的最新成果也給予了高度評價,有網友直接表示中國的開源AI技術已經達到了世界領先水平。AI Thinkers更是評論道,中國剛剛發布了一款怪物級的AI模型,這一評價無疑是對通義團隊最新成果的最高贊譽。