在編程領(lǐng)域的最新突破中,阿里巴巴開源了其通義千問系列中的全新AI編程大模型——Qwen3-Coder。這一模型的問世,標(biāo)志著開源編程模型在能力上實現(xiàn)了飛躍,不僅超越了諸如GPT4.1等閉源模型,更與全球頂尖的編程模型Claude4比肩而立。
Qwen3-Coder作為千問系列中的首個混合專家MoE架構(gòu)代碼模型,其參數(shù)規(guī)模龐大,總計達(dá)到4800億,其中激活參數(shù)為350億。這一模型原生支持256K token的上下文長度,且具備擴(kuò)展至1M長度的能力,為用戶提供了廣闊的操作空間。
在預(yù)訓(xùn)練階段,Qwen3-Coder使用了代碼占比高達(dá)70%的7.5T數(shù)據(jù),并通過強(qiáng)化學(xué)習(xí)在編程任務(wù)及智能體任務(wù)上進(jìn)行了后訓(xùn)練。這一訓(xùn)練策略顯著提升了模型的通用能力、代碼能力以及Agent能力。在WebArena和BFCL等評測中,Qwen3-Coder刷新了開源模型的紀(jì)錄,超越了GPT4.1。而在SWE-Bench評測中,該模型同樣表現(xiàn)出色,取得了開源模型中的最佳效果,與Claude4不相上下。
Qwen3-Coder憑借其卓越的Agent能力,在解決多步驟長任務(wù)時展現(xiàn)出強(qiáng)大的實力。它能夠全局規(guī)劃工作內(nèi)容,自主調(diào)用各種工具進(jìn)行深入鉆研,最終解決復(fù)雜的編程任務(wù)。這一能力使得網(wǎng)頁開發(fā)、AI搜索、深度研究等智能體應(yīng)用變得更加智能和高效。實測數(shù)據(jù)顯示,在執(zhí)行任務(wù)時,Qwen3-Coder調(diào)用的工具數(shù)量遠(yuǎn)超Claude,效果令人矚目。
對于程序員而言,Qwen3-Coder無疑是一款強(qiáng)大的助手。它能夠輕松完成基礎(chǔ)編程任務(wù),如寫代碼、補全代碼、修復(fù)Bug等,顯著提升編程工作效率。代碼測試、查詢生成等工作在Qwen3-Coder的幫助下,從人工編寫的數(shù)小時縮短至數(shù)分鐘。該模型還降低了普通人入門編程的門檻,讓AI氛圍編程成為現(xiàn)實,用戶只需一句話就能生成精妙復(fù)雜的3D物理模擬過程。
目前,Qwen3-Coder已在魔搭社區(qū)和HuggingFace等平臺開源,全球開發(fā)者可免費下載使用。同時,該模型即將接入阿里巴巴的AI編程產(chǎn)品通義靈碼,其API也已上線阿里云百煉。為了方便開發(fā)者更好地利用Qwen3-Coder,通義團(tuán)隊還開源了一款命令行工具Qwen Code。Qwen3-Coder的API可以與Claude Code、Cline等工具協(xié)同使用,為用戶提供更多樣化的編程體驗。
千問系列編程模型自推出以來,便受到了全球開發(fā)者的熱烈歡迎。截至目前,其全球下載量已突破2000萬次,成為最受歡迎的開源編程模型之一。阿里巴巴內(nèi)部也已開始大量使用AI編程技術(shù),一汽集團(tuán)、中國石油、建設(shè)銀行、平安集團(tuán)、南方航空、小鵬汽車等行業(yè)頭部企業(yè)也紛紛接入千問AI編程模型,共同推動編程技術(shù)的創(chuàng)新與發(fā)展。