在人工智能領域,國產開源大模型GLM-4.7的發布引發了廣泛關注。這款由智譜推出的模型,憑借其卓越的技術表現,在全球開源模型中脫穎而出,成為開發者們熱議的焦點。從技術指標到實際應用,GLM-4.7都展現出了強大的競爭力,被視為國產模型在智能體工具方向上的重要突破。
在專業編碼盲測榜單Code Arena上,GLM-4.7在Web開發方向排名第六,成為全球排名最高的開源模型,超越了GPT-5.2與Claude Sonnet 4.5,穩居國產模型榜首。這一成績的取得,得益于GLM-4.7在代碼、工具調用和推理能力三個方面的顯著升級。在代碼能力測試中,它在SWE-bench?Verified和LiveCodeBench?V6兩項基準上分別取得了73.8%和84.9%的高分,整體水平與Claude Sonnet 4.5相當,處于開源模型的第一梯隊。在復雜推理任務中,GLM-4.7在HLE(“人類最后的考試”)測試中,工具輔助條件下成績達到42.8%,較GLM?4.6提升超過12個百分點,甚至超過了GPT?5.1 High。工具調用能力方面,GLM?4.7在τ2?Bench中拿到87.4%的成績,BrowseComp在開啟上下文管理后提升至67.5%,在多輪網頁任務和交互式工具調用場景中表現穩定,進一步鞏固了其“智能體向”模型的定位。
GLM?4.7的內部思考機制也進行了重要調整。在“交錯思考”的基礎上,引入了保留式思考與輪級思考控制。模型會在每次生成和工具調用前進行推理,并在多輪任務中自動保留已有的思考結果,避免反復從零開始推導。開發者還可以按輪次決定是否啟用推理過程,在簡單請求中降低時延,在復雜任務中提高穩定性。這種設計增強了長任務執行中的一致性和可控性,為模型在代碼智能體、終端任務和工具協同類基準上的整體躍升提供了支撐。模型還針對前端美學、長文本穩定性、網頁生成結構等細節進行了優化。
為了驗證GLM?4.7在實際開發任務中的表現,智譜進行了100個真實編程任務的對比測試,覆蓋前端開發、后端邏輯和指令遵循三個核心方向。結果顯示,在前端任務中,GLM?4.7相較4.6版本勝率提升至64.6%,在指令遵循場景中達到58.3%,在后端方向勝率穩定在46.7%。除了單點生成能力,GLM?4.7還強化了多技能聯動能力。在Z.ai平臺上線的全棧技能環境中,GLM-4.7接入了全新的Skills模塊,支持調用ASR語音識別、TTS語音合成、GLM?4.6V視覺模型等多個模塊進行統一調度,實現了工具之間的“調度邏輯”打通。
在實際測試中,GLM?4.7的表現同樣令人印象深刻。在3D控制任務中,GLM?4.7輸出了一段可直接運行的HTML代碼,構建了一個由5000多個粒子構成的立體圣誕樹場景,并集成了手勢識別與UI反饋邏輯。用戶可以通過手勢控制圣誕樹的炸開與收攏,形成照片墻的旋轉動畫,整個過程流暢自然。在UI生成任務中,GLM?4.7成功復刻了iOS主界面,圖標可點擊,功能頁可交互,計算器還能進行基礎運算,整體體驗流暢,圖標風格和顏色搭配也具備基本審美。在前端代碼實現任務中,GLM?4.7生成了一個完整的雙人格斗游戲界面,高度還原Switch主機的Joy-Con手柄配色和布局,角色邏輯和按鍵響應完整,具備真實游戲的框架感。
GLM?4.7的發布,不僅提升了國產開源模型在全球的競爭力,也為開發者提供了更強大的工具。其開源代碼在全球社區中已被下載超6000萬次,付費API使用量長期居于OpenRouter全球前十,逐步進入開發者的實際工具列表。在智譜即將登陸港交所的背景下,GLM?4.7的上線標志著國產大模型企業正從科研模型、開源生態向“真實使用”與“市場驗證”過渡,開源國產模型正從“對標國際”邁向“領跑、實用”,GLM?4.7無疑是這一進程中的重要代表。











