訊 7月23日,今日,通義Qwen系列大模型迎來了其在代碼能力上的重要更新,專為Agent能力打造的全新代碼模型Qwen3-Coder正式發(fā)布。此次率先亮相的是該系列中最強(qiáng)大的版本——Qwen3-Coder-480B-A35B-Instruct,這是一款采用混合專家(MoE)架構(gòu)的大模型,旨在重塑AI在真實(shí)軟件工程環(huán)境中的應(yīng)用范式。
據(jù)介紹,Qwen3-Coder在核心能力上實(shí)現(xiàn)了多項(xiàng)突破。該模型原生便支持256K token的超長上下文窗口,并通過YaRN技術(shù)可擴(kuò)展至1M token,使其能夠輕松處理倉庫級(jí)的代碼庫或復(fù)雜的動(dòng)態(tài)數(shù)據(jù)(如Pull Request),這為其強(qiáng)大的代理能力奠定了基礎(chǔ)。在性能方面,官方信息顯示,Qwen3-Coder在多個(gè)關(guān)鍵的代理式任務(wù)評(píng)測中,包括代理式編碼(Agentic Coding)、瀏覽器使用(Agentic Browser-Use)和工具調(diào)用(Agentic Tool-Use),均取得了當(dāng)前開源模型的SOTA(業(yè)界最佳)效果,其綜合表現(xiàn)甚至可以與業(yè)界頂尖的閉源模型Claude Sonnet 4相媲美。
為了充分發(fā)揮新模型的潛力,團(tuán)隊(duì)還同步推出了一款配套的命令行工具Qwen Code。該工具在Gemini Code的基礎(chǔ)上進(jìn)行了二次開發(fā),通過深度的prompt和工具調(diào)用協(xié)議適配,能夠最大化激發(fā)Qwen3-Coder在執(zhí)行復(fù)雜編程任務(wù)時(shí)的代理表現(xiàn)。同時(shí),模型本身保持了開放性,可以與社區(qū)中流行的編程工具(如Claude Code、Cline等)結(jié)合使用。
此次Qwen3-Coder在能力上的躍升,得益于其在訓(xùn)練方法上的深度創(chuàng)新。在預(yù)訓(xùn)練階段,團(tuán)隊(duì)使用了總計(jì)高達(dá)7.5T token的海量數(shù)據(jù),其中代碼數(shù)據(jù)占比達(dá)到70%。更值得關(guān)注的是,團(tuán)隊(duì)并未沿用社區(qū)普遍聚焦于編程競賽題的訓(xùn)練路徑,而是選擇了在更廣泛、更真實(shí)的軟件工程任務(wù)上,大規(guī)模應(yīng)用強(qiáng)化學(xué)習(xí)(RL)。通過構(gòu)建一個(gè)可同時(shí)運(yùn)行兩萬個(gè)獨(dú)立環(huán)境的龐大驗(yàn)證系統(tǒng),模型得以在多輪交互中自主規(guī)劃、調(diào)用工具并從反饋中學(xué)習(xí),最終在衡量真實(shí)世界軟件問題解決能力的SWE-bench Verified榜單上,實(shí)現(xiàn)了開源模型的最佳成績。這一系列技術(shù)突破,標(biāo)志著AI代碼模型正從單純的代碼生成器,向能夠自主解決復(fù)雜工程問題的“AI軟件工程師”加速演進(jìn)。