阿里巴巴旗下的通義千問近日宣布,其旗艦版Qwen3模型迎來了一次重要更新,推出了名為Qwen3-235B-A22B-Instruct-2507-FP8的新版本,該版本特別引入了“非思考模式”的增強(qiáng)功能。
據(jù)官方介紹,此次更新的Qwen3模型在多項(xiàng)通用能力上實(shí)現(xiàn)了顯著提升,尤其是在指令遵循、邏輯推理、文本理解、數(shù)學(xué)運(yùn)算、科學(xué)知識、編程技能及工具使用等方面。在多個權(quán)威測評中,如GQPA(知識評估)、AIME25(數(shù)學(xué)競賽模擬)、LiveCodeBench(編程能力測試)、Arena-Hard(人類偏好對齊測試)以及BFCL(智能體能力評估)等,Qwen3均展現(xiàn)出了卓越的性能,超越了Kimi-K2、DeepSeek-V3等頂級開源模型,以及Claude-Opus4-Non-thinking等領(lǐng)先的閉源模型。
除了通用能力的提升,Qwen3新模型還在幾個關(guān)鍵性能方面實(shí)現(xiàn)了增強(qiáng)。首先,在多語言環(huán)境下,模型對于長尾知識的覆蓋能力有了顯著提升,能夠更好地理解和處理多種語言中的復(fù)雜信息。其次,在主觀及開放性任務(wù)中,模型對用戶偏好的契合能力得到了加強(qiáng),能夠生成更加貼合用戶需求、質(zhì)量更高的回復(fù)和文本。新模型的長文本處理能力也大幅提升至256K,進(jìn)一步增強(qiáng)了其上下文理解能力。
此次更新的Qwen3模型已經(jīng)在魔搭社區(qū)和HuggingFace平臺上開源發(fā)布,供開發(fā)者和研究人員免費(fèi)使用。這一舉措無疑將推動人工智能領(lǐng)域的技術(shù)創(chuàng)新和應(yīng)用發(fā)展,為更多行業(yè)帶來智能化的解決方案。
Qwen3新模型的推出,標(biāo)志著阿里巴巴在人工智能領(lǐng)域的研究和應(yīng)用又邁上了一個新的臺階。隨著技術(shù)的不斷進(jìn)步和應(yīng)用場景的不斷拓展,我們有理由相信,未來Qwen3將在更多領(lǐng)域發(fā)揮重要作用,為人們的生活和工作帶來更多便利和價值。