阿里巴巴于近日震撼發(fā)布其最新一代通義千問大語言模型——Qwen3,此舉標(biāo)志著中國在開源語言模型領(lǐng)域取得了世界級突破,Qwen3一躍成為全球頂尖的開源模型。
Qwen3的核心競爭力在于其開創(chuàng)性的混合推理架構(gòu),這是國內(nèi)首次將“快速思考”與“深度思考”機(jī)制融合于單一模型的創(chuàng)新實踐。該架構(gòu)不僅賦予Qwen3處理復(fù)雜問題時的多步驟深度推理能力,還能迅速響應(yīng)簡單任務(wù),實現(xiàn)了算力資源的高效利用,完美平衡了性能與效率。
Qwen3具備卓越的多語言處理能力,覆蓋簡體中文、繁體中文、粵語等119種語言和方言,這一特性顯著拓寬了其應(yīng)用場景,使其能夠更靈活地服務(wù)于全球范圍內(nèi)的用戶,滿足多樣化的語言需求。
為了滿足不同用戶群體的需求,阿里云精心推出了8款規(guī)模各異的Qwen3模型,其中包括兩款MoE(專家混合)模型:Qwen3-235B-A22B與Qwen3-30B-A3B,分別擁有2350億和300億總參數(shù),以及220億和30億激活參數(shù)。還有六款Dense模型,參數(shù)規(guī)模從0.6B至32B不等,為用戶提供了豐富的選擇空間。所有這些模型均在Apache 2.0許可協(xié)議下開源,用戶可以按需選用。
Qwen3系列模型現(xiàn)已通過GitHub和阿里云ModelScope平臺全面開源,并遵循Apache 2.0許可協(xié)議,支持免費商用。特別是旗艦級模型Qwen3-235B-A22B,其部署僅需4張H20顯卡,顯存占用僅為同類模型的三分之一,極大地降低了部署成本和使用難度。
阿里巴巴的這一重大發(fā)布,無疑為全球開源社區(qū)注入了新的活力,Qwen3憑借其獨特的混合推理架構(gòu)和強(qiáng)大的多語言處理能力,有望在多個領(lǐng)域掀起技術(shù)創(chuàng)新的浪潮。