滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 信息流 > 正文內(nèi)容

Qwen3小升級(jí)即SOTA，開源大模型王座快變中國(guó)內(nèi)部賽了

時(shí)間：2025-07-22 14:20:51 來(lái)源：量子位編輯：快訊團(tuán)隊(duì) IP：北京 發(fā)表評(píng)論無(wú)障礙通道

聞樂發(fā)自凹非寺量子位 | 公眾號(hào) QbitAI

開源大模型正在進(jìn)入中國(guó)時(shí)間。

Kimi K2風(fēng)頭正盛，然而不到一周，Qwen3就迎來(lái)最新升級(jí)，235B總參數(shù)量?jī)H占Kimi K2 1T規(guī)模的四分之一。

基準(zhǔn)測(cè)試性能上卻超越了Kimi K2。

Qwen官方還宣布不再使用混合思維模式，而是分別訓(xùn)練Instruct和Thinking模型。

所以，此次發(fā)布的新模型僅支持非思考模式，現(xiàn)在網(wǎng)頁(yè)版已經(jīng)可以上線使用了，但通義APP還未見更新。

Qwen官方還透露：這次只是一個(gè)小更新！大招很快就來(lái)了！

但總歸就是，再見Qwen3-235B-A22B，你好Qwen3-235B-A22B-2507了。

By the way，這個(gè)名字怎么取得越來(lái)越復(fù)雜了。

先來(lái)看看這次的“小更新”都有哪些～

增強(qiáng)了對(duì)256K長(zhǎng)上下文的理解能力

新模型是一款因果語(yǔ)言模型，采用MoE架構(gòu)，總參數(shù)量達(dá)235B，其中非嵌入?yún)?shù)為234B，推理時(shí)激活參數(shù)為22B

在官方介紹中顯示，模型共包含94層，采用分組查詢注意力（GQA）機(jī)制，配備64個(gè)查詢頭和4個(gè)鍵值頭，并設(shè)置128個(gè)專家，每次推理時(shí)激活8個(gè)專家。

該模型原生支持262144的上下文長(zhǎng)度。

這次改進(jìn)主要有以下幾個(gè)方面

顯著提升了通用能力，包括指令遵循、邏輯推理、文本理解、數(shù)學(xué)、科學(xué)、編碼和工具使用。大幅增加了多語(yǔ)言長(zhǎng)尾知識(shí)的覆蓋范圍。更好地符合用戶在主觀和開放式任務(wù)中的偏好，能夠提供更有幫助的響應(yīng)和更高質(zhì)量的文本生成。增強(qiáng)了對(duì)256K長(zhǎng)上下文的理解能力。

在官方發(fā)布的基準(zhǔn)測(cè)試中可以看到，相較于上一版本，新模型在AIME25上準(zhǔn)確率從24.7%上升到70.3%，表現(xiàn)出良好的數(shù)學(xué)推理能力。

而且對(duì)比Kimi K2、DeepSeek-V3，Qwen3新模型的能力也都略勝一籌。

為了提高使用體驗(yàn)，官方還推薦了最佳設(shè)置：

Qwen3新版本深夜發(fā)布就立刻收獲了一眾好評(píng)：Qwen在中等規(guī)模的語(yǔ)言模型中已經(jīng)領(lǐng)先。

也有網(wǎng)友感慨Qwen在開啟新的架構(gòu)范式：

One More Thing

有趣的是，就在Qwen3新模型發(fā)布的前兩天，NVIDIA也宣稱發(fā)布了新的SOTA開源模型OpenReasoning-Nemotron

該模型提供四個(gè)規(guī)模：1.5B、7B、14B和32B，并且可以實(shí)現(xiàn)100%本地運(yùn)行。

但實(shí)際上，這只是基于Qwen-2.5在Deepseek R1數(shù)據(jù)上微調(diào)的模型。

而現(xiàn)在Qwen3已經(jīng)更新，大招已經(jīng)被預(yù)告。

隨著Llama轉(zhuǎn)向閉源的消息傳出，OpenAI遲遲不見Open，開源基礎(chǔ)大模型的競(jìng)爭(zhēng)，現(xiàn)在正在進(jìn)入中國(guó)時(shí)間。

DeepSeek丟了王座，Kimi K2補(bǔ)上，Kimi K2坐穩(wěn)沒幾天，Qwen的挑戰(zhàn)就來(lái)了。

體驗(yàn)鏈接：https://chat.qwen.ai/

[1]https://x.com/Alibaba_Qwen/status/1947344511988076547[2]https://x.com/giffmana/status/1947362393983529005

— 完 —

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

更多>同類資訊

聊聊AI Coding的現(xiàn)狀與未來(lái)｜沙龍招募

07-22

我國(guó)研發(fā)的新型熒光探針分子可實(shí)現(xiàn)骨骼“發(fā)光”成像

07-22

蘋果在線商店正式登陸沙特阿拉伯，零售店計(jì)劃緊隨其后

07-22

雷軍稱特斯拉保值率一直非常不錯(cuò)

07-22

為何蘋果在AI上進(jìn)展緩慢？外媒：是一種戰(zhàn)略性謹(jǐn)慎，慢工出細(xì)活

07-22

機(jī)構(gòu)預(yù)估2025年折疊手機(jī)出貨量將達(dá)1980萬(wàn)支

07-22

移遠(yuǎn)通信正式加入Avanci 5G車輛項(xiàng)目

07-22

智己“超級(jí)增程”宣布8月1日全球首發(fā)

07-22

檢驗(yàn)檢測(cè)邁入“具身智能”時(shí)代：三維天地?cái)y手人形機(jī)器人創(chuàng)新中心打造數(shù)智化新生態(tài)

07-22

比亞迪第1300萬(wàn)輛新能源車下線

07-22

DeepMind奪得IMO官方「唯一」金牌，卻成為OpenAI大型社死現(xiàn)場(chǎng)

07-22

工信部擬規(guī)范零公里二手車市場(chǎng)，新車禁轉(zhuǎn)二手說(shuō)法為誤讀

07-22

小米電動(dòng)汽車YU7三分鐘售20萬(wàn)輛，跨界成就超越蘋果

07-22

AI大模型實(shí)測(cè)：部分在負(fù)面誘導(dǎo)下輸出危險(xiǎn)方案，專家呼吁加強(qiáng)監(jiān)管

07-22

OpenAI新任應(yīng)用CEO菲吉·西莫：8月上任，致力AI技術(shù)全球普及

07-22

點(diǎn)擊查看更多 +

全站最新

摩根大通：OpenAI未來(lái)四年將燒錢3000多億

產(chǎn)業(yè)鏈企業(yè)加速推進(jìn)項(xiàng)目建設(shè) 固態(tài)電池行業(yè)從0到1加速

馬斯克愿景落地：特斯拉超級(jí)充電站餐廳在好萊塢開業(yè)

俞敏洪、董宇輝，“分手”不后悔

雷軍隔天再夸特斯拉：保值率不錯(cuò)，但這次我們領(lǐng)先

聯(lián)想Legion Go 2掌機(jī)工程機(jī)遭偷跑：銳龍Z2處理器

熱門內(nèi)容

本欄最新

OpenAI新任應(yīng)用CEO菲吉·西莫：8月上任，致力AI技術(shù)全球普及

蘋果AI技術(shù)報(bào)告揭秘：端側(cè)內(nèi)存大減，云端引入PT-MoE新架構(gòu)

雷軍連續(xù)點(diǎn)贊特斯拉，小米SU7保值率奪冠展現(xiàn)實(shí)力

摩根大通：OpenAI未來(lái)四年將燒錢3000多億

產(chǎn)業(yè)鏈企業(yè)加速推進(jìn)項(xiàng)目建設(shè) 固態(tài)電池行業(yè)從0到1加速

馬斯克愿景落地：特斯拉超級(jí)充電站餐廳在好萊塢開業(yè)

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

Qwen3小升級(jí)即SOTA，開源大模型王座快變中國(guó)內(nèi)部賽了

日本精品一区二区三区高清久久