GLM-4.7 登頂 Artificial Analysis 全球開源榜首 - 新聞詳情 | YeLogs.com

GLM-4.7 登頂 Artificial Analysis 全球開源榜首

新聞

HongKong

51

11:53 AM · Dec 29 ,2025

智譜發文宣佈，GLM-4.7 在全球知名的權威大模型評測榜單 Artificial Analysis Intelligence Index（AA 智能指數）中，以 68 分綜合成績榮登開源模型與國產模型雙料榜首、全球第六。

Artificial Analysis Intelligence Index重點考核模型的知識儲備、邏輯推理、代碼生成及Agent（智能體）等核心維度，被業界公認為最能代表模型綜合實力的風向標。

GLM-4.7 是智譜於上週最新推出的開源大語言模型，新版本面向Coding場景強化了編碼能力、長程任務規劃與工具協同。在編程、推理與智能體三個維度實現突破。

更強的編程能力：顯著提升了模型在多語言編碼和在終端智能體中的效果；GLM-4.7現在可以在Claude Code、TRAE、Kilo Code、Cline和Roo Code等編程框架中實現“先思考、再行動”的機制，在複雜任務上有更穩定的表現。
前端審美提升：GLM-4.7在前端生成質量方面明顯進步，能夠生成觀感更佳的網頁、PPT、海報。
更強的工具調用能力：GLM-4.7提升了工具調用能力，在BrowseComp網頁任務評測中獲得67.5分；在τ²-Bench交互式工具調用評測中實現87.4分的開源SOTA，超過Claude Sonnet 4.5。
推理能力提升：顯著提升了數學和推理能力，在HLE（"人類最後的考試"）基準測試中獲得42.8%的成績，較GLM-4.6提升41%，超過GPT-5.1。
通用能力增強：GLM-4.7對話更簡潔智能且富有人情味，寫作與角色扮演更具文采與沉浸感。

0 位用戶收藏了這個故事！