訊 7月22日,阿里云通義千問Qwen大模型官方賬號公布對旗艦版Qwen3模型進行了更新,推出Qwen3-235B-A22B-FP8非思考模式(Non-thinking)的更新版本,命名為Qwen3-235B-A22B-Instruct-2507-FP8。此次更新,涵蓋指令遵循、邏輯推理、文本理解、數學、科學、編程及工具使用等多個關鍵領域。
資料顯示,新的Qwen3模型通用能力顯著提升。在GQPA(知識)、AIME25(數學)、LiveCodeBench(編程)、Arena-Hard(人類偏好對齊)、BFCL(Agent 能力)等測評里,它超越了Kimi-K2、DeepSeek-V3等開源模型,以及Claude-Opus4-Non-thinking等閉源模型。
不僅如此,新版Qwen3在關鍵性能方面實現了進一步增強。在多語言的長尾知識覆蓋上取得重要突破,極大地豐富了知識儲備;在主觀及開放性任務處理中,更能精準契合用戶偏好,生成的回復實用性更強,文本質量也更高;長文本處理能力提升至256K,上下文理解能力得以進一步強化,能夠更好地應對復雜內容。
目前,Qwen3新模型已在魔搭社區和HuggingFace上開源更新。