滾動資訊

當(dāng)前位置：首頁 > 資訊 > 信息流 > 正文內(nèi)容

剛剛！Qwen3深夜升級，碾壓Kimi K2和DeepSeek V3

時(shí)間：2025-07-22 09:36:04 來源：新智元編輯：快訊團(tuán)隊(duì) IP：北京 發(fā)表評論無障礙通道

剛剛，Qwen3迎來驚喜升級！[慶祝][慶祝][慶祝]

通義千問更新了旗艦版Qwen3模型，推出Qwen3-235B-A22B-FP8非思考模式（Non-thinking）的更新版本，命名為：

Qwen3-235B-A22B-Instruct-2507-FP8。

新的Qwen3模型，通用能力顯著提升，包括指令遵循、邏輯推理、文本理解、數(shù)學(xué)、科學(xué)、編程及工具使用等方面。

在GQPA（知識）、AIME25（數(shù)學(xué)）、LiveCodeBench（編程）、Arena-Hard（人類偏好對齊）、BFCL（Agent能力）等眾多測評中表現(xiàn)出色，超過Kimi-K2、DeepSeek-V3等頂級開源模型以及Claude-Opus4-Non-thinking等領(lǐng)先閉源模型。

剛剛更新的Qwen3模型，還增強(qiáng)了以下關(guān)鍵性能：· 在多語言的長尾知識覆蓋方面，模型取得顯著進(jìn)步。· 在主觀及開放性任務(wù)中，模型顯著增強(qiáng)了對用戶偏好的契合能力，能夠提供更有用的回復(fù)，生成更高質(zhì)量的文本。· 長文本提升到256K，上下文理解能力進(jìn)一步增強(qiáng)。

為獲得最佳性能，阿里也貼心地為大家準(zhǔn)備了推薦配置：· 采樣參數(shù)：Temperature=0.7、TopP=0.8、TopK=20、MinP=0 · 合適的輸出長度：輸出長度為16,384Token，這對于指令模型來說已經(jīng)足夠· 規(guī)范輸出格式：數(shù)學(xué)問題：在提示詞中加入「請一步一步推理，并將最終答案放入x5cboxed{}中。」多項(xiàng)選擇題：在提示詞中添加以下JSON結(jié)構(gòu)以規(guī)范回復(fù)格式：「請?jiān)赼nswer字段中僅填寫選項(xiàng)字母，例如："answer": "C"。」

注意：此模型僅支持非思考模式，在輸出中不會生成塊。同時(shí)，不再需要指定enable_thinking=False。

目前，Qwen3新模型已在魔搭社區(qū)和Hugging Face上開源：https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507-FP8

舉報(bào) 0 收藏 0 打賞 0評論 0

更多>同類資訊

你認(rèn)可嗎！陳震：現(xiàn)階段華為乾坤ADS輔助駕駛表現(xiàn)最好沒有之一

07-22

俞敏洪、董宇輝，“分手”不后悔

07-22

蘋果 tvOS 26 支持指定任意 AirPlay 揚(yáng)聲器永久輸出

07-22

出境游打車更方便了：Uber上線官方微信小程序，可中文檢索微信支付

07-22

喻國明：解決AI時(shí)代下的主流媒介價(jià)值角色問題，南都有優(yōu)勢

07-22

威勝信息與華為深化戰(zhàn)略合作

07-22

國創(chuàng)中心與帝奧微共探業(yè)務(wù)合作新契機(jī)

07-22

國創(chuàng)中心與帝奧微共探業(yè)務(wù)合作新契機(jī)

07-22

胡泳：AI造謠真假難辨，媒體要讓事實(shí)在算法漩渦中重新浮現(xiàn)

07-22

幕墻清洗機(jī)器人開啟建筑領(lǐng)域運(yùn)維新模式

07-22

AI正式進(jìn)軍影視制作！爭議聲中奈飛(NFLX.US)率先試水Runway AI視頻工具

07-22

馬斯克愿景落地：特斯拉首家超級充電站餐廳開業(yè)，不限品牌車主

07-22

深挖蘋果 AI 報(bào)告：端側(cè)內(nèi)存占用少 37.5%、云端創(chuàng)新 PT-MoE 架構(gòu)

07-22

鴻蒙智行享界S9T路測實(shí)車照流出，新車功能性能正測試中

07-22

小米SU7保值率奪冠，雷軍：特斯拉很棒，但我們這次領(lǐng)先了

07-22

點(diǎn)擊查看更多 +

全站最新

阿里通義千問Qwen3模型升級，長文本處理能力躍升至256K

AI模型“雙面人”？Anthropic研究揭示偽對齊現(xiàn)象

摩根士丹利稱蘋果無意進(jìn)軍AI搜索，預(yù)計(jì)2025財(cái)年Q3收入將增至907億美元

摩根士丹利展望蘋果財(cái)報(bào)：不太可能收購AI搜索公司

三星被曝正考慮Galaxy Z Fold8折疊手機(jī)材質(zhì)

羅馬仕現(xiàn)狀曝光：僅剩20多人在崗、5000萬庫存

熱門內(nèi)容

本欄最新

小米SU7保值率奪冠，雷軍：特斯拉很棒，但我們這次領(lǐng)先了

微軟“電影和電視”商店關(guān)閉，流媒體業(yè)務(wù)調(diào)整持續(xù)進(jìn)行

餐飲企業(yè)熱捧炒菜機(jī)器人：高效降本，廚師短缺不再愁

雅虎日本推行生成式AI新工作模式，1.1萬員工將全面應(yīng)用以提升效率

阿里通義千問Qwen3模型升級，長文本處理能力躍升至256K

AI模型“雙面人”？Anthropic研究揭示偽對齊現(xiàn)象

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

剛剛！Qwen3深夜升級，碾壓Kimi K2和DeepSeek V3

日本精品一区二区三区高清久久