日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

阿里通義Qwen3強勢登場,全球最強開源模型再添新成員

   時間:2025-05-07 14:43:45 來源:ITBEAR編輯:快訊團隊 發(fā)表評論無障礙通道

近日,阿里巴巴旗下的通義平臺迎來了重大更新,正式推出了新一代開源模型Qwen3,該模型在通義App及網(wǎng)頁版中全面上線。用戶現(xiàn)在可以在專屬智能體“千問大模型”及主對話頁面,率先體驗到這一被譽為全球最強開源模型的智能實力。

Qwen3一經(jīng)問世,便憑借其卓越的智能水平和高效的算力利用,迅速登頂全球最強開源模型榜單。該系列模型共包含8款不同尺寸,均采用了創(chuàng)新的“混合推理模型”架構(gòu)。其中,旗艦款Qwen3-235B-A22B作為一款混合專家(MoE)模型,更是在性能上刷新了國產(chǎn)模型及全球開源模型的新紀錄。

在代碼、數(shù)學、通用能力等基準測試中,Qwen3-235B-A22B展現(xiàn)出了與DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等頂級模型相媲美的競爭力。小型MoE模型Qwen3-30B-A3B雖然激活參數(shù)數(shù)量僅為QwQ-32B的10%,但其表現(xiàn)卻更為出色。而Qwen3-32B作為一款稠密(Dense)模型,則以其低部署成本、高穩(wěn)定性和高效性,成為了企業(yè)部署的首選。

通義此次還慷慨地開源了兩個MoE模型的權(quán)重,分別是擁有2350多億總參數(shù)和220多億激活參數(shù)的Qwen3-235B-A22B,以及擁有約300億總參數(shù)和30億激活參數(shù)的小型MoE模型Qwen3-30B-A3B。同時,六個Dense模型也已在Apache 2.0許可下全面開源,包括Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。

目前,經(jīng)過后訓練的Qwen3模型,如Qwen3-30B-A3B等,已在Hugging Face、ModelScope和Kaggle等平臺上開放使用。用戶還可以在Qwen Chat網(wǎng)頁版(chat.qwen.ai)和通義APP中親自試用Qwen3,感受其強大的智能魅力。

Qwen3模型不僅智能強大,還具備豐富的功能特性。它支持兩種思考模式:深入思考和快速思考。在深入思考模式下,模型會逐步推理,深思熟慮后給出最終答案,非常適合解決復雜問題;而在快速思考模式下,模型則提供快速、近乎即時的響應,適用于對速度要求高于深度的簡單問題。用戶可以根據(jù)具體任務需求,靈活控制模型進行不同程度的“思考”。

Qwen3模型還支持多達119種語言和方言,使其能夠跨越語言障礙,為全球用戶提供智能服務。這一多語言功能無疑大大增強了Qwen3的適用性和競爭力。

Qwen3的出色表現(xiàn)也贏得了廣大網(wǎng)友的一致好評。網(wǎng)友們紛紛表示,Qwen3能快能慢、答案精準,在編碼、數(shù)學和語言處理等方面都表現(xiàn)出色。有網(wǎng)友甚至感慨:“開源模型已經(jīng)很久沒有這么好了。”

Qwen3的成功離不開通義團隊在預訓練和后訓練方面的精心打造。在預訓練階段,通義實現(xiàn)了三重升級:數(shù)據(jù)增強、階段訓練和性能突破。通過構(gòu)建覆蓋119種語言、規(guī)模達36萬億token的強大數(shù)據(jù)集,以及分階段訓練和優(yōu)化性能,Qwen3得以在智能水平上實現(xiàn)質(zhì)的飛躍。

在后訓練方面,通義實施了一個四階段的訓練流程,包括長思維鏈冷啟動、長思維鏈強化學習、思維模式融合和通用強化學習。這一流程確保了Qwen3能夠在不同任務和領(lǐng)域中表現(xiàn)出色,并具備強大的通用能力。

Qwen3的使用也非常便捷。用戶可以在Hugging Face transformers中使用Qwen3模型,并通過簡單的參數(shù)設(shè)置來禁用思考模式。同時,用戶還可以使用多種代碼庫進行本地開發(fā),如ollama、LMStudio、llama.cpp以及ktransformers等。

Qwen3在工具調(diào)用方面也表現(xiàn)出色。Qwen-Agent內(nèi)部封裝了工具調(diào)用模板和工具調(diào)用解析器,大大降低了代碼復雜性,使得用戶能夠更加方便地使用各種工具。

回顧過去,從Qwen2.5-Max到Qwen3的推出,阿里巴巴在通用人工智能(AGI)的道路上不斷取得新的里程碑。此次Qwen3的亮點在于其“雙模推理”技術(shù),為用戶提供了在深度推理和及時響應之間自由切換的能力,并提供了計算資源動態(tài)分配接口,以滿足不同場景的需求。未來,通義團隊將繼續(xù)努力提升模型性能,推動人工智能技術(shù)的不斷發(fā)展。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 巴彦淖尔市| 成都市| 麻阳| 汶川县| 兰溪市| 甘孜| 东丽区| 汝南县| 安平县| 秭归县| 玛多县| 奉化市| 遵化市| 托克逊县| 桑日县| 宿州市| 康乐县| 十堰市| 娱乐| 板桥市| 中方县| 密云县| 武平县| 巴里| 乌兰县| 滦平县| 上高县| 进贤县| 金阳县| 裕民县| 大竹县| 翁源县| 云阳县| 黄冈市| 深圳市| 离岛区| 马边| 隆德县| 黄陵县| 景东| 海伦市|