阿里巴巴今日震撼發布Qwen3-Coder,這款代碼模型以其前所未有的代理能力,成為了業界關注的焦點。Qwen3-Coder系列中最為強大的版本——Qwen3-Coder-480B-A35B-Instruct,采用了創新的MoE架構設計,480B基礎參數激活35B特定參數,不僅原生支持256K token的上下文處理,還能通過YaRN技術擴展至1M token,展現了卓越的代碼生成與Agent能力。
Qwen3-Coder-480B-A35B-Instruct在Agentic Coding、Agentic Browser-Use及Agentic Tool-Use等多個領域取得了開源模型的頂尖成績,其性能與Claude Sonnet4不相上下。阿里官方透露,借助Qwen3-Coder,新手程序員能夠大幅提升工作效率,一天內完成的工作量相當于資深程序員一周的成果,甚至能在短短5分鐘內生成一個品牌官網。
與此同時,阿里巴巴還推出了Qwen Code,這是一款專為代理式編程設計的命令行工具。Qwen Code基于Gemini Code進行深度優化,通過定制化的prompt和工具調用協議,最大限度地激發了Qwen3-Coder在Agentic Coding任務上的潛力。Qwen3-Coder還能與Claude Code、Cline等社區內的優秀編程工具無縫集成,為用戶提供多樣化的編程體驗。
目前,Qwen3-Coder已在阿里云旗下的百煉大模型服務平臺上線,其API采用靈活的階梯計費模式,根據用戶的輸入token量調整價格。在256K至1M的輸入范圍內,價格為6美元/百萬token(輸入)和60美元/百萬token(輸出),相比之下,Claude Sonnet 4的輸入輸出價格分別為3美元/百萬token和15美元/百萬token,與Qwen3-Coder在128k至256k檔位的定價相當。
為了提升Qwen3-Coder的代碼能力,阿里巴巴從多個維度進行了模型優化。數據方面,總計7.5T的訓練數據(其中70%為代碼),確保了模型在保持通用與數學能力的同時,擁有出色的編程技能。上下文處理上,模型原生支持256K的上下文長度,并可通過YaRN技術擴展至1M,專為處理大型代碼倉庫和動態數據(如Pull Request)而設計。阿里巴巴還利用Qwen2.5-Coder對低質數據進行清洗與重寫,顯著提升了整體數據質量。
在強化學習方面,阿里巴巴采取了獨特的策略,不僅在豐富的真實代碼任務上擴展了Code RL訓練,還通過自動擴展測試樣例,構造了大量高質量的訓練實例,成功釋放了強化學習的潛力。在Long-Horizon RL階段,模型學會了在真實軟件工程環境中進行多輪交互,包括規劃、執行、接受反饋和再決策。同時,阿里巴巴還實現了可驗證環境的擴展系統,借助阿里云的基礎設施,能夠同時運行20k個獨立環境,為模型提供了大規模的強化學習反饋和評測。
Qwen3-Coder的推出,標志著阿里巴巴在編程AI助手領域的又一重大突破。通過多元化的使用方案和生態集成,Qwen3-Coder降低了開發者的接入門檻,為編程行業帶來了全新的變革。無論是通過自研的Qwen Code工具,還是與Claude Code、Cline等主流編程工具的集成,Qwen3-Coder都能為用戶提供高效、便捷的編程體驗。隨著企業對自動化編程需求的不斷增長,Qwen3-Coder的市場前景值得期待。