滾動資訊

當前位置：首頁 > 資訊 > 信息流 > 正文內容

通義千問深夜“王炸”更新！Qwen3升級版全面超越Kimi-K2，Agent能力亮眼

時間：2025-07-22 09:36:48 來源：華爾街見聞官方編輯：快訊團隊 IP：北京 發表評論無障礙通道

國內的AI大模型競賽，再次被按下了加速鍵！

AI圈的小伙伴們可能還記得，幾天前Kimi-K2的開源還在被津津樂道。然而，開源的王座，熱度還沒持續幾天，就迎來了新的挑戰者。

7月22日凌晨，阿里巴巴通義千問團隊突然發布了旗艦模型Qwen3的重磅更新，推出 Qwen3-235B-A22B-FP8 非思考模式（Non-thinking）的更新版本，命名為Qwen3-235B-A22B-Instruct-2507-FP8。

新版本模型在多項核心能力上實現了驚人飛躍，不僅全面超越了Kimi-K2等頂級開源模型，甚至領先Claude-Opus4-Non-thinking等頂級閉源模型。

性能“爆表”，這次升級有多猛？

根據官方發布的數據，新模型的通用能力獲得了全方位強化，在多個權威測評中表現極其亮眼：

包括指令遵循、邏輯推理、文本理解、數學、科學、編程及工具使用等方面，在GQPA（知識）、AIME25（數學）、LiveCodeBench（編程）、Arena-Hard（人類偏好對齊）、BFCL（Agent能力）等眾多測評中表現出色，超過Kimi-K2、DeepSeek-V3等頂級開源模型以及Claude-Opus4-Non-thinking等領先閉源模型。

本次更新的Qwen3模型在Agent能力尤其亮眼：在BFCL（Agent能力）測評中表現卓越。這意味著模型在理解復雜指令、自主規劃、調用工具以完成任務的能力上，達到了一個新的高度。“主打Agent”，將是未來AI應用的核心競爭力。

除了硬核的跑分，這次更新還帶來了三大“體感”升級：

-在多語言的長尾知識覆蓋方面，模型取得顯著進步。-在主觀及開放性任務中，模型顯著增強了對用戶偏好的契合能力，能夠提供更有用的回復，生成更高質量的文本。-長文本提升到256K，上下文理解能力進一步增強。告別“混合思維”，分離訓練有多強？

這次最核心的變化，是技術路線的革新。

通義千問團隊宣布，正式告別此前的“混合思維模式”，邁向全新的“分離訓練”時代。他們將用于直接回答的Instruct模型和用于復雜思考的Thinking模型進行獨立訓練。

簡單來說，就是讓“快思考”和“慢思考”各司其職，從而在各自的領域都做到極致。

本次發布的 Qwen3-235B-A22B-Instruct-2507-FP8 ，就是“快思考”路線下的最新成果。它主打非思考模式（Non-thinking），追求的是在指令遵循、文本理解和知識問答等任務上，做到更快、更準、更強~

開源圈“卷”出新高度，大招還在后頭！

從Kimi-K2到DeepSeek-V3，再到今天的Qwen3新版，國內的開源AI競賽已經進入白熱化階段。每一次更新都伴隨著性能的飛躍和王座的更迭。

更讓人激動的是，通義千問團隊在發布更新的同時，還留下了一個懸念：

“還有大招，馬上就要來了！”

這不禁讓人猜想，分離訓練的另一端——專注于復雜推理的“Thinking”模型是否也已在路上？

目前，最新的Qwen3模型已在魔搭社區（ModelScope）和HuggingFace全面開源更新。如果你是AI開發者或愛好者，現在就可以去親身體驗這個“開源新王”的威力了

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

剛剛！Qwen3深夜升級，碾壓Kimi K2和DeepSeek V3

07-22

你認可嗎！陳震：現階段華為乾坤ADS輔助駕駛表現最好沒有之一

07-22

俞敏洪、董宇輝，“分手”不后悔

07-22

蘋果 tvOS 26 支持指定任意 AirPlay 揚聲器永久輸出

07-22

出境游打車更方便了：Uber上線官方微信小程序，可中文檢索微信支付

07-22

喻國明：解決AI時代下的主流媒介價值角色問題，南都有優勢

07-22

威勝信息與華為深化戰略合作

07-22

國創中心與帝奧微共探業務合作新契機

07-22

國創中心與帝奧微共探業務合作新契機

07-22

胡泳：AI造謠真假難辨，媒體要讓事實在算法漩渦中重新浮現

07-22

幕墻清洗機器人開啟建筑領域運維新模式

07-22

AI正式進軍影視制作！爭議聲中奈飛(NFLX.US)率先試水Runway AI視頻工具

07-22

馬斯克愿景落地：特斯拉首家超級充電站餐廳開業，不限品牌車主

07-22

深挖蘋果 AI 報告：端側內存占用少 37.5%、云端創新 PT-MoE 架構

07-22

鴻蒙智行享界S9T路測實車照流出，新車功能性能正測試中

07-22

點擊查看更多 +

全站最新

剛剛！Qwen3深夜升級，碾壓Kimi K2和DeepSeek V3

你認可嗎！陳震：現階段華為乾坤ADS輔助駕駛表現最好沒有之一

俞敏洪、董宇輝，“分手”不后悔

蘋果 tvOS 26 支持指定任意 AirPlay 揚聲器永久輸出

出境游打車更方便了：Uber上線官方微信小程序，可中文檢索微信支付

喻國明：解決AI時代下的主流媒介價值角色問題，南都有優勢

熱門內容

本欄最新

小米SU7保值率奪冠，雷軍：特斯拉很棒，但我們這次領先了

微軟“電影和電視”商店關閉，流媒體業務調整持續進行

餐飲企業熱捧炒菜機器人：高效降本，廚師短缺不再愁

雅虎日本推行生成式AI新工作模式，1.1萬員工將全面應用以提升效率

阿里通義千問Qwen3模型升級，長文本處理能力躍升至256K

AI模型“雙面人”？Anthropic研究揭示偽對齊現象

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

通義千問深夜“王炸”更新！Qwen3升級版全面超越Kimi-K2，Agent能力亮眼

日本精品一区二区三区高清久久