GLM-4.7 震撼发布 | 不仅是超越,更是对 AGI 认知的重塑!

大模型机器学习算法

智谱 AI 正式发布 GLM-4.7!

这不仅仅是一次简单的版本号更新,它是专为**“编码” “复杂推理”**而生的超级进化。如果你觉得之前的 AI 编程只是“辅助”,那么 GLM-4.7 将让你看到什么是真正的“数字合伙人”。

🚀国产之光,硬刚全球顶尖模型

在最新的技术报告中,GLM-4.7 展现出了令人惊叹的爆发力。

picture.image

我们直接看数据:在编程界最具含金量的 SWE-bench (解决真实 GitHub 问题)测试中,GLM-4.7 取得了 73.8% 的惊人成绩,比前代足足提升了 5.8%

而在更能体现“硬实力”的数学竞赛 AIME 2025 上,它的得分高达 95.7 ,几乎触及了目前 AI 推理的上限。

📊 17 项基准测试全线飘红

| Benchmark | GLM-4.7 | GLM-4.6 | Kimi K2 Thinking | DeepSeek-V3.2 | Gemini 3.0 Pro | Claude Sonnet 4.5 | GPT-5-High | GPT-5.1-High | | --- | --- | --- | --- | --- | --- | --- | --- | --- | | MMLU-Pro | 84.3 | 83.2 | 84.6 | 85.0 | 90.1 | 88.2 | 87.5 | 87.0 | | GPQA-Diamond | 85.7 | 81.0 | 84.5 | 82.4 | 91.9 | 83.4 | 85.7 | 88.1 | | HLE | 24.8 | 17.2 | 23.9 | 25.1 | 37.5 | 13.7 | 26.3 | 25.7 | | HLE (w/ Tools) | 42.8 | 30.4 | 44.9 | 40.8 | 45.8 | 32.0 | 35.2 | 42.7 | | AIME 2025 | 95.7 | 93.9 | 94.5 | 93.1 | 95.0 | 87.0 | 94.6 | 94.0 | | HMMT Feb. 2025 | 97.1 | 89.2 | 89.4 | 92.5 | 97.5 | 79.2 | 88.3 | 96.3 | | HMMT Nov. 2025 | 93.5 | 87.7 | 89.2 | 90.2 | 93.3 | 81.7 | 89.2 |

| | IMOAnswerBench | 82.0 | 73.5 | 78.6 | 78.3 | 83.3 | 65.8 | 76.0 |

| | LiveCodeBench-v6 | 84.9 | 82.8 | 83.1 | 83.3 | 90.7 | 64.0 | 87.0 | 87.0 | | SWE-bench Verified | 73.8 | 68.0 | 71.3 | 73.1 | 76.2 | 77.2 | 74.9 | 76.3 | | SWE-bench Multilingual | 66.7 | 53.8 | 61.1 | 70.2 |

| 68.0 | 55.3 |

| | Terminal Bench Hard | 33.3 | 23.6 | 30.6 | 35.4 | 39.0 | 33.3 | 30.5 | 43.0 | | Terminal Bench 2.0 | 41.0 | 24.5 | 35.7 | 46.4 | 54.2 | 42.8 | 35.2 | 47.6 | | BrowseComp | 52.0 | 45.1 |

| 51.4 |

| 24.1 | 54.9 | 50.8 | | BrowseComp (w/ Context Manage) | 67.5 | 57.5 | 60.2 | 67.6 | 59.2 |

|

|

| | BrowseComp-Zh | 66.6 | 49.5 | 62.3 | 65.0 |

| 42.4 | 63.0 |

| | τ²-Bench | 87.4 | 75.2 | 74.3 | 85.3 | 90.7 | 87.2 | 82.4 | 82.7 |


🧠 它,真的会“三思而后行”

为什么 GLM-4.7 这么强?因为它掌握了 AI 进化的关键钥匙——交错思考(Interleaved Thinking)

以往的 AI 往往是“脱口而出”,而 GLM-4.7 引入了全新的思考机制:

交错思考 :在行动前先规划,每一步操作都经过深思熟虑。

保留思考(Retained Thinking) :在长达几千行的代码修改中,它能记住之前的推理逻辑,不会“做着做着就忘了”,让复杂任务的稳定性直线飙升。

回合级控制 :你可以灵活决定什么时候让它“深思”,什么时候让它“快答”,平衡效率与成本。


🎨 不止于代码,更是审美大师

你以为它只是个“码农”?错了。GLM-4.7 带来了全新的氛围编程(Atmospheric Coding)

  • UI 质量跃迁 :生成的网页不再是简陋的 Demo,而是自带现代感、布局精准、配色高级的商业级页面。
  • PPT 自动生成 :它能理解复杂的排版逻辑,生成的幻灯片布局准确,直接告别熬夜做 PPT 的痛苦。

智谱 AGI 宣言:

“真正的智能不仅仅是通过考试;最终,AGI 的成功将由它如何无缝地融入我们的生活来衡量。”


🛠 本地部署,即刻上手

GLM-4.7 对开发者极其友好,完美支持 vLLMSGLang 等主流推理框架。无论你是想在云端调用 API,还是在本地私有化部署,全部一键搞定。

核心配置建议:

  • 通用任务 :Temperature 1.0, Top-p 0.95
  • 严谨编程 :Temperature 0.7
  • 代理任务 :务必开启【保留思考模式】!

📢 立即体验

在这个 AI 浪潮中,谁掌握了最高效的生产力工具,谁就掌握了未来。

👉 一键直达体验: chat.z.ai

📖 深度技术博客: z.ai/blog/glm-4.7

💻 开源仓库: GitHub - zai-org/GLM-4.5

欢迎在评论区分享:你最希望 GLM-4.7 帮你解决哪一个编程难题?我们将随机抽取 5 位小伙伴送出高级版 API 体验额度!

想了解更多关于 GLM-4.7 的实测案例吗?关注我们,不迷路!

picture.image

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
VikingDB:大规模云原生向量数据库的前沿实践与应用
本次演讲将重点介绍 VikingDB 解决各类应用中极限性能、规模、精度问题上的探索实践,并通过落地的案例向听众介绍如何在多模态信息检索、RAG 与知识库等领域进行合理的技术选型和规划。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论