大模型競(jìng)技場(chǎng)LMArena最新公布的排名顯示,國(guó)產(chǎn)人工智能領(lǐng)域迎來(lái)重要突破。智譜科技于9月30日發(fā)布的GLM-4.6模型,在綜合性能評(píng)估中位列全球第四,與阿里巴巴旗下Qwen3-Max-Preview模型并列中國(guó)區(qū)榜首,同時(shí)摘得全球開(kāi)源模型桂冠。
根據(jù)技術(shù)文檔披露,GLM-4.6在編程能力、長(zhǎng)文本處理、邏輯推理、信息檢索、內(nèi)容創(chuàng)作及智能體應(yīng)用等六大核心領(lǐng)域?qū)崿F(xiàn)全面升級(jí)。在公開(kāi)測(cè)試基準(zhǔn)中,該模型的代碼生成能力已達(dá)到國(guó)際領(lǐng)先水平,與Claude Sonnet 4模型持平,成為國(guó)內(nèi)目前表現(xiàn)最優(yōu)的編程專用模型。
在創(chuàng)意寫(xiě)作維度,GLM-4.6憑借出色的文本生成質(zhì)量登頂全球榜首。這一突破性表現(xiàn)使其同時(shí)斬獲Hugging Face趨勢(shì)榜和全球大模型API市場(chǎng)OpenRouter的榜首位置,形成雙平臺(tái)領(lǐng)先的競(jìng)爭(zhēng)優(yōu)勢(shì)。
值得注意的是,阿里巴巴通義千問(wèn)Qwen3-Max的正式版本0923在本次評(píng)測(cè)中表現(xiàn)分化。雖然其數(shù)學(xué)運(yùn)算能力位居全球首位,但整體性能僅位列第九,未能超越此前發(fā)布的預(yù)覽版本。這種版本迭代中的性能波動(dòng)現(xiàn)象,引發(fā)業(yè)界對(duì)模型優(yōu)化策略的深入討論。
自9月以來(lái),國(guó)產(chǎn)大模型呈現(xiàn)集中突破態(tài)勢(shì)。除GLM-4.6外,Qwen3-Max、Kimi K2等模型在多項(xiàng)技術(shù)指標(biāo)上均取得顯著進(jìn)步。這種技術(shù)迭代速度的加快,標(biāo)志著中國(guó)AI產(chǎn)業(yè)正在形成具有國(guó)際競(jìng)爭(zhēng)力的技術(shù)集群。











