阿里云近期在智能編程領域投下了一枚震撼彈,正式對外宣布其AI編程大模型Qwen3-Coder將全面開放源代碼。這一消息迅速在業界引發了廣泛關注,Qwen3-Coder憑借其出色的代碼生成與Agent能力,在Agentic Coding、Agentic Browser-Use以及基礎編碼任務等多個方面均達到了開源模型的前沿水平,無疑為智能編程技術的發展開啟了新篇章。
Qwen3-Coder系列模型提供了多樣化的規格選擇,而此次率先開源的版本是其性能最為強勁的一款——Qwen3-Coder-480B-A35B-Instruct。該模型基于先進的MoE架構,參數量高達4800億,激活參數為350億,原生支持256K的上下文長度,并通過YaRN技術可擴展至1M,這為處理龐大的代碼庫和復雜動態數據提供了強有力的支撐。
在預訓練階段,阿里云通義團隊通過一系列創新策略顯著增強了Qwen3-Coder的代碼處理能力。數據層面,7.5萬億字節的訓練數據中,代碼占比高達70%,確保了模型在保持通用性和數學能力的同時,編程能力也達到了卓越水平。在上下文處理方面,模型原生支持的長上下文能力專為大型代碼倉庫和動態數據設計,大幅提升了Agentic Coding的效率和精準度。團隊還采用了合成數據擴展技術,利用Qwen2.5-Coder對低質量數據進行清洗和重寫,進一步提升了數據質量。
進入后訓練階段,通義團隊引入了執行驅動的大規模強化學習策略,通過自動擴展測試樣例,構建了海量的高質量訓練實例。這一策略不僅大幅提升了代碼的執行成功率,還對其他任務產生了顯著的正面效應。在真實世界的軟件工程任務中,如SWE-Bench,Qwen3-Coder展現了卓越的自主規劃、工具調用和決策能力,在SWE-bench Verified上取得了開源模型的最佳成績。
為了讓開發者更便捷地使用Qwen3-Coder,通義團隊還推出了命令行工具Qwen Code。該工具針對Qwen3-Coder系列模型進行了專門的優化,增強了解析器和工具支持,使開發者能夠更充分地挖掘模型在代理式編程上的潛力。同時,Qwen3-Coder的API還與Claude Code、Cline等編程工具實現了協同工作,為開發者提供了更加靈活高效的編程體驗。
目前,Qwen3-Coder已在魔搭社區和HuggingFace等平臺全面開放源代碼,全球開發者均可免費下載和使用。該模型即將接入阿里的AI編程產品通義靈碼,進一步拓展其應用場景。阿里云百煉平臺也已上線了Qwen3-Coder的API,為開發者提供了更為便捷的接入途徑。
想要了解更多關于Qwen3-Coder的信息,請訪問以下鏈接:
魔搭社區:https://modelscope.cn/models/Qwen/Qwen3-Coder-480B-A35B-Instruct
Hugging Face:https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507
Qwen Code GitHub:https://github.com/QwenLM/qwen-code