阿里通義千問近期發(fā)布了其旗艦版Qwen3模型的重大更新,推出了名為Qwen3-235B-A22B-Instruct-2507-FP8的新版本,該版本主打非思考模式。此次升級,Qwen3在多個核心能力上實現(xiàn)了顯著飛躍。
據(jù)官方介紹,新版Qwen3在指令遵循、邏輯推理、文本解讀、數(shù)學運算、科學知識、編程技巧及工具應用等多個維度均有所增強。在一系列權威測試中,如GQPA知識評估、AIME25數(shù)學競賽模擬、LiveCodeBench編程挑戰(zhàn)、Arena-Hard人類偏好對齊測試以及BFCL智能體能力評測,Qwen3均展現(xiàn)出了卓越表現(xiàn),甚至超越了諸如Kimi-K2、DeepSeek-V3等頂尖開源模型,以及Claude-Opus4-Non-thinking等領先的閉源模型。
值得注意的是,就在新版Qwen3發(fā)布前不久,國際知名大模型排行榜LMArena宣布,開源模型Kimi K2憑借其萬億參數(shù)的強大實力,登頂全球開源模型排行榜首位。盡管如此,新版Qwen3依然憑借自身實力,在業(yè)界引起了廣泛關注。
此次升級,Qwen3不僅在通用能力上有所提升,還在多個關鍵性能指標上取得了顯著進步。特別是在多語言長尾知識的覆蓋上,模型的表現(xiàn)有了質(zhì)的飛躍。同時,在處理主觀及開放性任務時,Qwen3能夠更好地理解并契合用戶偏好,提供更加有用和高質(zhì)量的回復。新模型的長文本處理能力也大幅提升至256K,進一步增強了其上下文理解能力。
目前,這一全新升級的Qwen3模型已經(jīng)在魔搭社區(qū)和HuggingFace平臺上開源發(fā)布,供開發(fā)者們下載和使用。