國內的AI大模型競賽,再次被按下了加速鍵!
AI圈的小伙伴們可能還記得,幾天前Kimi-K2的開源還在被津津樂道。然而,開源的王座,熱度還沒持續幾天,就迎來了新的挑戰者。
7月22日凌晨,阿里巴巴通義千問團隊突然發布了旗艦模型Qwen3的重磅更新,推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名為Qwen3-235B-A22B-Instruct-2507-FP8。
新版本模型在多項核心能力上實現了驚人飛躍,不僅全面超越了Kimi-K2等頂級開源模型,甚至領先Claude-Opus4-Non-thinking等頂級閉源模型。
性能“爆表”,這次升級有多猛?
根據官方發布的數據,新模型的通用能力獲得了全方位強化,在多個權威測評中表現極其亮眼:
包括指令遵循、邏輯推理、文本理解、數學、科學、編程及工具使用等方面,在GQPA(知識)、AIME25(數學)、LiveCodeBench(編程)、Arena-Hard(人類偏好對齊)、BFCL(Agent能力)等眾多測評中表現出色,超過Kimi-K2、DeepSeek-V3等頂級開源模型以及Claude-Opus4-Non-thinking等領先閉源模型。
本次更新的Qwen3模型在Agent能力尤其亮眼:在BFCL(Agent能力)測評中表現卓越。這意味著模型在理解復雜指令、自主規劃、調用工具以完成任務的能力上,達到了一個新的高度。“主打Agent”,將是未來AI應用的核心競爭力。
除了硬核的跑分,這次更新還帶來了三大“體感”升級:
-在多語言的長尾知識覆蓋方面,模型取得顯著進步。-在主觀及開放性任務中,模型顯著增強了對用戶偏好的契合能力,能夠提供更有用的回復,生成更高質量的文本。-長文本提升到256K,上下文理解能力進一步增強。告別“混合思維”,分離訓練有多強?
這次最核心的變化,是技術路線的革新。
通義千問團隊宣布,正式告別此前的“混合思維模式”,邁向全新的“分離訓練”時代。他們將用于直接回答的Instruct模型和用于復雜思考的Thinking模型進行獨立訓練。
簡單來說,就是讓“快思考”和“慢思考”各司其職,從而在各自的領域都做到極致。
本次發布的 Qwen3-235B-A22B-Instruct-2507-FP8 ,就是“快思考”路線下的最新成果。它主打非思考模式(Non-thinking),追求的是在指令遵循、文本理解和知識問答等任務上,做到更快、更準、更強~
開源圈“卷”出新高度,大招還在后頭!
從Kimi-K2到DeepSeek-V3,再到今天的Qwen3新版,國內的開源AI競賽已經進入白熱化階段。每一次更新都伴隨著性能的飛躍和王座的更迭。
更讓人激動的是,通義千問團隊在發布更新的同時,還留下了一個懸念:
“還有大招,馬上就要來了!”
這不禁讓人猜想,分離訓練的另一端——專注于復雜推理的“Thinking”模型是否也已在路上?
目前,最新的Qwen3模型已在魔搭社區(ModelScope)和HuggingFace全面開源更新。如果你是AI開發者或愛好者,現在就可以去親身體驗這個“開源新王”的威力了