阿里巴巴旗下的Qwen團(tuán)隊(duì)近日宣布了一項(xiàng)重大進(jìn)展,他們最新一代的旗艦編程模型Qwen3-Coder-480B-A35B-Instruct已正式向公眾開源。這款模型被Qwen團(tuán)隊(duì)譽(yù)為迄今為止最強(qiáng)大的開源智能體編程模型,不僅在參數(shù)規(guī)模上達(dá)到了480B,而且在智能體編程、瀏覽器使用以及工具調(diào)用等多個(gè)任務(wù)上均展現(xiàn)出卓越的性能。
據(jù)Qwen團(tuán)隊(duì)介紹,Qwen3-Coder在基準(zhǔn)測(cè)試中取得了開源領(lǐng)域的頂尖成績(jī),超越了包括Kimi K2、DeepSeek V3在內(nèi)的多個(gè)開源模型,以及閉源模型GPT-4.1,其表現(xiàn)甚至可與以編程能力見長(zhǎng)的Claude Sonnet 4相媲美。這款模型原生支持256K上下文,并可通過特殊技術(shù)擴(kuò)展至100萬上下文,最大輸出達(dá)到6.5萬token,為用戶提供了前所未有的編程體驗(yàn)。
除了強(qiáng)大的模型本身,Qwen團(tuán)隊(duì)還開源了一個(gè)基于Gemini Code分叉而來的智能體編程命令行工具——Qwen Code。這款工具經(jīng)過定制提示和函數(shù)調(diào)用協(xié)議的適配,能夠更充分地釋放Qwen3-Coder在智能體編程任務(wù)上的潛力,為用戶提供更加便捷、高效的編程體驗(yàn)。
Qwen3-Coder已在阿里云旗下的大模型服務(wù)平臺(tái)百煉上線,其API采用階梯計(jì)費(fèi)方式,根據(jù)輸入token量調(diào)整價(jià)格。用戶可以根據(jù)自身需求選擇合適的計(jì)費(fèi)檔位,靈活控制成本。Qwen3-Coder的480B版本也已在Hugging Face、魔搭等開源社區(qū)發(fā)布,供用戶下載和本地部署。
在Qwen3-Coder發(fā)布前,這一模型已經(jīng)悄然在Qwen Chat官網(wǎng)上線,引發(fā)海外網(wǎng)友的一片熱議。不少網(wǎng)友分享了實(shí)測(cè)案例,展示了Qwen3-Coder在指令遵循、UI設(shè)計(jì)、動(dòng)畫等方面的驚人能力。例如,有網(wǎng)友讓Qwen3-Coder打造一個(gè)Wordle單詞游戲,結(jié)果模型不僅快速交付了游戲頁面和源代碼,而且在審美和用戶體驗(yàn)上也達(dá)到了較高水準(zhǔn)。
在技術(shù)層面,Qwen團(tuán)隊(duì)在博客中分享了Qwen3-Coder的部分訓(xùn)練細(xì)節(jié)。預(yù)訓(xùn)練階段,模型使用了7.5萬億token數(shù)據(jù),其中代碼占比高達(dá)70%,確保了模型在編程方面的卓越表現(xiàn)。后訓(xùn)練階段,Qwen團(tuán)隊(duì)引入了長(zhǎng)視距強(qiáng)化學(xué)習(xí),鼓勵(lì)模型通過多輪交互解決現(xiàn)實(shí)世界任務(wù),進(jìn)一步提升了模型的實(shí)用性和泛化能力。
Qwen團(tuán)隊(duì)表示,他們?nèi)栽诓粩嗯μ嵘鼵oding Agent的性能,旨在讓它承擔(dān)更多復(fù)雜和乏味的軟件工程任務(wù),從而釋放人類的生產(chǎn)力。未來,Qwen3-Coder的更多模型尺寸也將陸續(xù)推出,以滿足不同用戶的需求和場(chǎng)景。