智譜發文宣佈,GLM-4.7 在全球知名的權威大模型評測榜單 Artificial Analysis Intelligence Index(AA 智能指數)中,以 68 分綜合成績榮登開源模型與國產模型雙料榜首、全球第六。
Artificial Analysis Intelligence Index重點考核模型的知識儲備、邏輯推理、代碼生成及Agent(智能體)等核心維度,被業界公認為最能代表模型綜合實力的風向標。
GLM-4.7 是智譜於上週最新推出的開源大語言模型,新版本面向Coding場景強化了編碼能力、長程任務規劃與工具協同。在編程、推理與智能體三個維度實現突破。
- 更強的編程能力:顯著提升了模型在多語言編碼和在終端智能體中的效果;GLM-4.7現在可以在Claude Code、TRAE、Kilo Code、Cline和Roo Code等編程框架中實現“先思考、再行動”的機制,在複雜任務上有更穩定的表現。
- 前端審美提升:GLM-4.7在前端生成質量方面明顯進步,能夠生成觀感更佳的網頁、PPT、海報。
- 更強的工具調用能力:GLM-4.7提升了工具調用能力,在BrowseComp網頁任務評測中獲得67.5分;在τ²-Bench交互式工具調用評測中實現87.4分的開源SOTA,超過Claude Sonnet 4.5。
- 推理能力提升:顯著提升了數學和推理能力,在HLE("人類最後的考試")基準測試中獲得42.8%的成績,較GLM-4.6提升41%,超過GPT-5.1。
- 通用能力增強:GLM-4.7對話更簡潔智能且富有人情味,寫作與角色扮演更具文采與沉浸感。