阿里巴巴旗下的通義千問平臺(tái)近期揭曉了其旗艦級(jí)Qwen3模型的重大更新,一款名為Qwen3-235B-A22B-Instruct-2507-FP8的新版本正式亮相,該版本特別引入了“非思考模式”的優(yōu)化。
據(jù)官方介紹,此次升級(jí)后的Qwen3模型在多方面展現(xiàn)出了顯著的能力躍升。無論是遵循指令、邏輯推理、文本深度解析,還是在數(shù)學(xué)、科學(xué)探索、編程技能及工具應(yīng)用等領(lǐng)域,Qwen3均交出了令人矚目的成績(jī)單。在一系列權(quán)威測(cè)試中,如GQPA知識(shí)評(píng)估、AIME25數(shù)學(xué)競(jìng)賽模擬、LiveCodeBench編程挑戰(zhàn)、Arena-Hard人類偏好對(duì)齊測(cè)試,以及BFCL智能體能力評(píng)測(cè),Qwen3均超越了諸如Kimi-K2、DeepSeek-V3等開源界的佼佼者,以及閉源領(lǐng)域的先鋒Claude-Opus4-Non-thinking。
此次更新不僅鞏固了Qwen3在通用智能方面的領(lǐng)先地位,還在幾個(gè)關(guān)鍵性能指標(biāo)上實(shí)現(xiàn)了突破。首先,模型在多語言環(huán)境下的長(zhǎng)尾知識(shí)覆蓋能力得到了大幅度提升,使得信息檢索更為全面和準(zhǔn)確。其次,面對(duì)主觀性和開放性任務(wù)時(shí),Qwen3能更加精準(zhǔn)地捕捉并貼合用戶的個(gè)人偏好,提供更具實(shí)用性和高質(zhì)量的回復(fù)內(nèi)容。模型的長(zhǎng)文本處理能力也躍升至256K,進(jìn)一步增強(qiáng)了其在復(fù)雜上下文中的理解和分析能力。
升級(jí)后的Qwen3模型已面向公眾開放,用戶可以在魔搭社區(qū)及HuggingFace平臺(tái)上獲取這一最新版本。這一舉措無疑將加速人工智能技術(shù)在更廣泛領(lǐng)域的應(yīng)用和探索。
隨著Qwen3-235B-A22B-Instruct-2507-FP8版本的發(fā)布,業(yè)界對(duì)于人工智能技術(shù)的未來發(fā)展充滿了期待,相信這一創(chuàng)新將為各行各業(yè)帶來更加智能和高效的解決方案。