阿里云近期在智能編程領(lǐng)域投下了一枚震撼彈,正式對(duì)外宣布其AI編程大模型Qwen3-Coder將全面開放源代碼。這一消息迅速在業(yè)界引發(fā)了廣泛關(guān)注,Qwen3-Coder憑借其出色的代碼生成與Agent能力,在Agentic Coding、Agentic Browser-Use以及基礎(chǔ)編碼任務(wù)等多個(gè)方面均達(dá)到了開源模型的前沿水平,無疑為智能編程技術(shù)的發(fā)展開啟了新篇章。
Qwen3-Coder系列模型提供了多樣化的規(guī)格選擇,而此次率先開源的版本是其性能最為強(qiáng)勁的一款——Qwen3-Coder-480B-A35B-Instruct。該模型基于先進(jìn)的MoE架構(gòu),參數(shù)量高達(dá)4800億,激活參數(shù)為350億,原生支持256K的上下文長(zhǎng)度,并通過YaRN技術(shù)可擴(kuò)展至1M,這為處理龐大的代碼庫(kù)和復(fù)雜動(dòng)態(tài)數(shù)據(jù)提供了強(qiáng)有力的支撐。
在預(yù)訓(xùn)練階段,阿里云通義團(tuán)隊(duì)通過一系列創(chuàng)新策略顯著增強(qiáng)了Qwen3-Coder的代碼處理能力。數(shù)據(jù)層面,7.5萬(wàn)億字節(jié)的訓(xùn)練數(shù)據(jù)中,代碼占比高達(dá)70%,確保了模型在保持通用性和數(shù)學(xué)能力的同時(shí),編程能力也達(dá)到了卓越水平。在上下文處理方面,模型原生支持的長(zhǎng)上下文能力專為大型代碼倉(cāng)庫(kù)和動(dòng)態(tài)數(shù)據(jù)設(shè)計(jì),大幅提升了Agentic Coding的效率和精準(zhǔn)度。團(tuán)隊(duì)還采用了合成數(shù)據(jù)擴(kuò)展技術(shù),利用Qwen2.5-Coder對(duì)低質(zhì)量數(shù)據(jù)進(jìn)行清洗和重寫,進(jìn)一步提升了數(shù)據(jù)質(zhì)量。
進(jìn)入后訓(xùn)練階段,通義團(tuán)隊(duì)引入了執(zhí)行驅(qū)動(dòng)的大規(guī)模強(qiáng)化學(xué)習(xí)策略,通過自動(dòng)擴(kuò)展測(cè)試樣例,構(gòu)建了海量的高質(zhì)量訓(xùn)練實(shí)例。這一策略不僅大幅提升了代碼的執(zhí)行成功率,還對(duì)其他任務(wù)產(chǎn)生了顯著的正面效應(yīng)。在真實(shí)世界的軟件工程任務(wù)中,如SWE-Bench,Qwen3-Coder展現(xiàn)了卓越的自主規(guī)劃、工具調(diào)用和決策能力,在SWE-bench Verified上取得了開源模型的最佳成績(jī)。
為了讓開發(fā)者更便捷地使用Qwen3-Coder,通義團(tuán)隊(duì)還推出了命令行工具Qwen Code。該工具針對(duì)Qwen3-Coder系列模型進(jìn)行了專門的優(yōu)化,增強(qiáng)了解析器和工具支持,使開發(fā)者能夠更充分地挖掘模型在代理式編程上的潛力。同時(shí),Qwen3-Coder的API還與Claude Code、Cline等編程工具實(shí)現(xiàn)了協(xié)同工作,為開發(fā)者提供了更加靈活高效的編程體驗(yàn)。
目前,Qwen3-Coder已在魔搭社區(qū)和HuggingFace等平臺(tái)全面開放源代碼,全球開發(fā)者均可免費(fèi)下載和使用。該模型即將接入阿里的AI編程產(chǎn)品通義靈碼,進(jìn)一步拓展其應(yīng)用場(chǎng)景。阿里云百煉平臺(tái)也已上線了Qwen3-Coder的API,為開發(fā)者提供了更為便捷的接入途徑。
想要了解更多關(guān)于Qwen3-Coder的信息,請(qǐng)?jiān)L問以下鏈接:
魔搭社區(qū):https://modelscope.cn/models/Qwen/Qwen3-Coder-480B-A35B-Instruct
Hugging Face:https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507
Qwen Code GitHub:https://github.com/QwenLM/qwen-code