在人工智能領域,國產大模型正以驚人速度追趕國際頂尖水平。智譜最新發布的GLM-4.7開源模型,憑借在代碼生成、工具調用和復雜推理等核心指標上的突破性表現,成功躋身全球開源模型第一梯隊。根據Code Arena全球開發者盲測榜單,該模型在Web開發方向排名第六,超越GPT-5.2與Claude Sonnet 4.5,成為當前全球排名最高的開源模型,同時穩居國產模型榜首。
技術突破體現在多維度的性能躍升。在代碼能力方面,GLM-4.7在SWE-bench Verified基準測試中取得73.8%的準確率,LiveCodeBench V6測試達84.9%,整體水平對齊Claude Sonnet 4.5。復雜推理任務中,HLE(人類水平考試)成績在工具輔助條件下提升至42.8%,較前代提升超12個百分點,超越GPT-5.1 High版本。工具調用能力成為最大亮點,在τ2-Bench測試中取得87.4%的優異成績,BrowseComp在開啟上下文管理后提升至67.5%,展現出穩定的多輪交互能力。
這些提升源于內部思考機制的革新。模型在原有"交錯思考"基礎上,引入保留式思考與輪級控制機制。每次生成或調用工具前,系統會先進行獨立推理,并在多輪任務中自動保留歷史思考結果,避免重復推導。開發者可根據任務復雜度選擇是否啟用完整推理流程,在簡單請求中降低延遲,在復雜任務中確保穩定性。這種設計顯著提升了長任務執行的一致性,為代碼智能體、終端任務和工具協同等場景提供技術支撐。
真實任務測試驗證了模型的工程價值。在覆蓋前端開發、后端邏輯和指令遵循的100個編程任務中,GLM-4.7前端任務勝率達64.6%,指令遵循場景勝率58.3%,后端復雜任務勝率穩定在46.7%。更值得關注的是多模態技能調度能力,通過全新Skills模塊,模型可統一調度ASR語音識別、TTS語音合成和GLM-4.6V視覺模型,實現跨模態工具鏈的完整閉環。
在Z.ai平臺的實測中,模型展現出驚人的交互創造力。測試人員要求生成"3D圣誕樹炸開成照片墻"的交互場景,模型輸出完整HTML代碼,構建出由5000多個粒子組成的立體圣誕樹,頂部帶有輝光星星。通過攝像頭識別手勢動作,用戶張開手掌時圣誕樹炸開為懸浮照片墻,握拳時重新收縮為樹形,整個過程伴隨流暢的粒子動畫和UI反饋。更令人驚喜的是,代碼中集成了InstancedMesh渲染優化技術,在不依賴構建工具的情況下保持高幀率運行。
另一個測試案例中,模型1:1復刻iOS主界面,不僅實現Safari、健康等圖標的點擊交互,日歷、計算器等功能頁也能正常操作。在雙人格斗游戲測試中,生成的界面高度還原Switch手柄配色布局,左側藍色手柄對應鍵盤AD移動、JK攻擊,右側紅色手柄對應UIO技能釋放,中間主屏幕顯示動態血條和波次信息,完整構建出游戲框架。
開源社區的熱烈反響印證著模型的市場價值。GLM系列代碼全球下載量已突破6000萬次,付費API使用量長期位居OpenRouter全球前十。隨著智譜即將登陸港交所,這款模型的發布不僅標志著技術實力的突破,更成為國產大模型從實驗室走向產業應用的關鍵轉折點。當開源模型開始主導開發者工具鏈,當國產技術開始定義行業標準,人工智能領域的競爭格局正在發生深刻變革。











