日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

通義千問深夜“王炸”更新!Qwen3升級版全面超越Kimi-K2,Agent能力亮眼

   時間:2025-07-22 09:36:48 來源:華爾街見聞官方編輯:快訊團隊 IP:北京 發表評論無障礙通道
 

國內的AI大模型競賽,再次被按下了加速鍵!

AI圈的小伙伴們可能還記得,幾天前Kimi-K2的開源還在被津津樂道。然而,開源的王座,熱度還沒持續幾天,就迎來了新的挑戰者。

7月22日凌晨,阿里巴巴通義千問團隊突然發布了旗艦模型Qwen3的重磅更新,推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名為Qwen3-235B-A22B-Instruct-2507-FP8。

新版本模型在多項核心能力上實現了驚人飛躍,不僅全面超越了Kimi-K2等頂級開源模型,甚至領先Claude-Opus4-Non-thinking等頂級閉源模型。

性能“爆表”,這次升級有多猛?

根據官方發布的數據,新模型的通用能力獲得了全方位強化,在多個權威測評中表現極其亮眼:

包括指令遵循、邏輯推理、文本理解、數學、科學、編程及工具使用等方面,在GQPA(知識)、AIME25(數學)、LiveCodeBench(編程)、Arena-Hard(人類偏好對齊)、BFCL(Agent能力)等眾多測評中表現出色,超過Kimi-K2、DeepSeek-V3等頂級開源模型以及Claude-Opus4-Non-thinking等領先閉源模型。

本次更新的Qwen3模型在Agent能力尤其亮眼:在BFCL(Agent能力)測評中表現卓越。這意味著模型在理解復雜指令、自主規劃、調用工具以完成任務的能力上,達到了一個新的高度。“主打Agent”,將是未來AI應用的核心競爭力。

除了硬核的跑分,這次更新還帶來了三大“體感”升級:

-在多語言的長尾知識覆蓋方面,模型取得顯著進步。-在主觀及開放性任務中,模型顯著增強了對用戶偏好的契合能力,能夠提供更有用的回復,生成更高質量的文本。-長文本提升到256K,上下文理解能力進一步增強。告別“混合思維”,分離訓練有多強?

這次最核心的變化,是技術路線的革新。

通義千問團隊宣布,正式告別此前的“混合思維模式”,邁向全新的“分離訓練”時代。他們將用于直接回答的Instruct模型和用于復雜思考的Thinking模型進行獨立訓練。

簡單來說,就是讓“快思考”和“慢思考”各司其職,從而在各自的領域都做到極致。

本次發布的 Qwen3-235B-A22B-Instruct-2507-FP8 ,就是“快思考”路線下的最新成果。它主打非思考模式(Non-thinking),追求的是在指令遵循、文本理解和知識問答等任務上,做到更快、更準、更強~

開源圈“卷”出新高度,大招還在后頭!

從Kimi-K2到DeepSeek-V3,再到今天的Qwen3新版,國內的開源AI競賽已經進入白熱化階段。每一次更新都伴隨著性能的飛躍和王座的更迭。

更讓人激動的是,通義千問團隊在發布更新的同時,還留下了一個懸念:

“還有大招,馬上就要來了!”

這不禁讓人猜想,分離訓練的另一端——專注于復雜推理的“Thinking”模型是否也已在路上?

目前,最新的Qwen3模型已在魔搭社區(ModelScope)和HuggingFace全面開源更新。如果你是AI開發者或愛好者,現在就可以去親身體驗這個“開源新王”的威力了

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  開放轉載  |  滾動資訊  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 克什克腾旗| 保靖县| 桑植县| 泽州县| 阳朔县| 汕头市| 陵水| 宁武县| 宣恩县| 大田县| 武义县| 河曲县| 全南县| 衡阳县| 肇州县| 澳门| 北碚区| 高青县| 中山市| 金沙县| 铜梁县| 武邑县| 灌南县| 土默特右旗| 临澧县| 原阳县| 浑源县| 会东县| 安宁市| 阿鲁科尔沁旗| 皋兰县| 都兰县| 聊城市| 江达县| 北碚区| 峨边| 德钦县| 志丹县| 三亚市| 逊克县| 霍州市|