近期,阿里通義千問在其技術(shù)版圖上邁出了重要一步,正式推出了Qwen3模型的全新旗艦版本——Qwen3-235B-A22B-Instruct-2507-FP8。這一新版本特別引入了非思考模式(Non-thinking)的改進,標(biāo)志著模型在智能化處理上的又一突破。
據(jù)官方介紹,Qwen3-235B-A22B-Instruct-2507-FP8在多個關(guān)鍵領(lǐng)域展現(xiàn)了顯著提升,包括但不限于指令遵循、邏輯推理、文本解析、數(shù)學(xué)運算、科學(xué)知識、編程技能以及工具應(yīng)用能力。在多項權(quán)威測評中,如GQPA知識評估、AIME25數(shù)學(xué)挑戰(zhàn)、LiveCodeBench編程測試、Arena-Hard人類偏好對齊測試以及BFCL Agent能力評估,Qwen3均取得了優(yōu)異成績,超越了諸如Kimi-K2、DeepSeek-V3等頂尖開源模型,以及閉源領(lǐng)域的佼佼者Claude-Opus4-Non-thinking。
就在Qwen3發(fā)布前夕,國際知名大模型排行榜LMArena傳來消息,宣布月之暗面的萬億參數(shù)開源模型Kimi K2榮登全球開源模型榜首,這無疑為Qwen3的發(fā)布增添了幾分競技色彩。
然而,Qwen3并未因此遜色,其在多語言長尾知識覆蓋上的顯著進步,以及在主觀和開放性任務(wù)中對用戶偏好的高度契合,都是其脫穎而出的亮點。模型不僅能夠提供更加貼合用戶需求的回復(fù),還能生成質(zhì)量更高的文本內(nèi)容。Qwen3的長文本處理能力已提升至256K,上下文理解能力得到進一步增強,為用戶帶來了更加流暢和智能的體驗。
目前,這一全新版本的Qwen3模型已在魔搭社區(qū)和HuggingFace平臺上開源更新,供開發(fā)者和研究人員自由下載和使用。這一舉措無疑將推動人工智能技術(shù)的進一步發(fā)展,為行業(yè)注入新的活力。