阿里巴巴旗下的通義千問平臺近日揭曉了其旗艦產品Qwen3模型的重大升級,全新版本Qwen3-235B-A22B-Instruct-2507-FP8正式面世,該版本特別引入了“非思考模式”的改進。
此次更新的Qwen3模型,在多項通用能力上實現了顯著提升,尤其是在指令理解、邏輯推理、文本解析、數學運算、科學知識、編程技能及工具運用等方面。在多個權威評測中,如GQPA知識評估、AIME25數學測試、LiveCodeBench編程基準測試、Arena-Hard人類偏好對齊測試以及BFCL智能體能力評估,Qwen3均展現出了卓越表現,超越了諸如Kimi-K2、DeepSeek-V3等頂級開源模型,以及Claude-Opus4-Non-thinking等領先的非開源模型。
不僅如此,Qwen3模型在此次更新中還強化了多項關鍵性能指標。首先,在多語言環境下,模型對于長尾知識的覆蓋能力有了顯著提升,能夠更好地應對跨語言的信息檢索需求。其次,在處理主觀性和開放性任務時,模型對用戶偏好的把握更加精準,能夠生成更加貼合用戶期望、質量更高的回復和文本內容。模型的長文本處理能力也得到了大幅提升,支持處理長達256K的文本,進一步增強了上下文理解能力。
升級后的Qwen3模型已在魔搭社區和HuggingFace平臺上開源發布,供開發者及研究人員下載和使用。這一舉措無疑將推動人工智能領域的技術創新和應用拓展,為更多行業帶來智能化升級的可能性。
此次Qwen3模型的升級,不僅彰顯了阿里巴巴在人工智能技術領域的深厚積累和創新實力,也為全球AI社區的發展注入了新的活力。