通義靈碼團(tuán)隊(duì)近期正式推出了Qwen3,并慷慨地開(kāi)源了八款“混合推理模型”,這一舉動(dòng)標(biāo)志著編程智能體技術(shù)邁入了一個(gè)嶄新的發(fā)展階段。此次開(kāi)源涵蓋了兩種基于MoE架構(gòu)的模型——Qwen3-235B-A22B與Qwen3-30B-A3B,前者擁有超過(guò)2350億的總參數(shù)和220多億的激活參數(shù),后者則具備300億總參數(shù)和30億激活參數(shù)。還有六個(gè)Dense模型系列,從Qwen3-32B到Qwen3-0.6B,滿足了不同場(chǎng)景下的需求。
Qwen3的明星產(chǎn)品Qwen3-235B-A22B在多項(xiàng)基準(zhǔn)測(cè)試中大放異彩,包括代碼理解、數(shù)學(xué)運(yùn)算及通用能力測(cè)試,與DeepSeek-R1、o1、o3-mini、Grok-3及Gemini-2.5-Pro等業(yè)界頂尖模型相比,Qwen3-235B-A22B展現(xiàn)出了卓越的競(jìng)爭(zhēng)力。這一卓越表現(xiàn)不僅彰顯了Qwen3的技術(shù)優(yōu)勢(shì),更為其在各種實(shí)際應(yīng)用中的廣泛部署鋪平了道路。
通義靈碼團(tuán)隊(duì)還宣布Qwen3模型現(xiàn)已無(wú)縫集成到VSCode、Visual Studio及JetBrains系列IDE的靈碼插件中。這意味著開(kāi)發(fā)者可以在他們熟悉的開(kāi)發(fā)環(huán)境中直接使用Qwen3,從而大幅提升編程效率和代碼質(zhì)量。
Qwen3模型設(shè)計(jì)獨(dú)特,支持兩種截然不同的思考模式:思考模式與非思考模式。在思考模式下,模型會(huì)進(jìn)行詳盡的推理步驟,最終給出深思熟慮的答案,非常適合解決復(fù)雜問(wèn)題。而在非思考模式下,模型則提供快速、即時(shí)的響應(yīng),適用于處理簡(jiǎn)單任務(wù)。這種靈活性使得用戶可以根據(jù)具體需求靈活調(diào)整模型的“思考”深度,實(shí)現(xiàn)高效且穩(wěn)定的“思考預(yù)算”管理。
多語(yǔ)言能力也是Qwen3的一大亮點(diǎn),它支持多達(dá)119種語(yǔ)言和方言,為國(guó)際用戶帶來(lái)了前所未有的便利。這一廣泛的語(yǔ)言覆蓋使得全球開(kāi)發(fā)者都能享受到Qwen3的強(qiáng)大功能。
在Agent能力方面,Qwen3同樣表現(xiàn)出色,在BFCL評(píng)測(cè)中取得了70.8的高分,超越了Gemini2.5-Pro、OpenAI-o1等領(lǐng)先模型。這一成就意味著使用Qwen3作為Agent時(shí),調(diào)用工具的門檻將大大降低。Qwen3原生支持MCP協(xié)議,并具備強(qiáng)大的工具調(diào)用能力。結(jié)合Qwen-Agent框架提供的工具調(diào)用模板和解析器,開(kāi)發(fā)者可以更加輕松地進(jìn)行編碼工作,極大地降低了開(kāi)發(fā)復(fù)雜度。
通義靈碼即將推出的編程智能體將進(jìn)一步增強(qiáng)開(kāi)發(fā)者的工具配置能力,支持自定義MCP工具,并集成魔搭MCP廣場(chǎng)。開(kāi)發(fā)者將能夠一鍵下載MCP服務(wù),這一創(chuàng)新舉措無(wú)疑將推動(dòng)編程智能體技術(shù)的進(jìn)一步發(fā)展,為開(kāi)發(fā)者提供更加全面和強(qiáng)大的支持。
感興趣的開(kāi)發(fā)者可以通過(guò)以下鏈接下載Qwen3模型:https://lingma.aliyun.com/download。