新品6 分钟阅读2026-06-15

GLM-5.2 解读：最强开源模型，国产模型离 Claude Opus 只差 1%

基于智谱官方发布与公开评测，解读 GLM-5.2——专注 Coding 与长程任务的 MIT 开源模型，FrontierSWE 仅比 Opus 4.8 低 1%，成本却只有 GPT-5.5 的六分之一。附 QuickRouter 实时价格与国内直连接入。

开源模型和闭源之间的差距，一直是大模型圈最被关心的问题。智谱在 2026 年 6 月给出的答案是 GLM-5.2——一个 MIT 协议开源、专注 Coding 与长程任务、号称"排名最高的开源模型"的新版本。

最让人意外的是一组对比：在 FrontierSWE（测试 AI 能否像软件工程师一样完成技术项目的基准）上，GLM-5.2 仅比 Claude Opus 4.8 低 1%，反而超过了 GPT-5.5。而它的 API 价格只有 GPT-5.5 的六分之一。

这篇文章基于智谱官方发布与公开评测，解读 GLM-5.2 到底强在哪、开源意味着什么、以及国内开发者怎么用、要花多少钱。

说明

本文的能力描述来自智谱官方发布与公开第三方评测，非本站实测。涉及的能力结论均标注来源，价格数据为 QuickRouter 控制台实时值。建议你用注册赠送的额度，拿自己的真实任务验证。

一、GLM-5.2 在卷什么？官方公布的三件事

根据智谱官方发布，GLM-5.2 的升级重点可以归纳成三件事。

1. Solid 1M：100 万 token 无损上下文

GLM-5.2 实现了 Solid 1M——100 万 token 的无损上下文窗口。官方强调这"不是简单扩展上下文长度"，而是针对长程 Coding Agent 场景做了数月强化训练，覆盖大规模实现、自动化研究、性能优化等任务。

这对开发者意味着什么？以前让模型读一个超长代码仓库或一份巨型文档，模型会"读到后面忘了前面"。GLM-5.2 的 100 万 token 上下文让它能真正处理整个项目级别的任务，而不只是单个文件。

2. Coding 与长程任务的代际提升

GLM-5.2 重点强化了编程能力。从公开 benchmark 看：

基准	GLM-5.2	GLM-5.1	提升幅度
Terminal-Bench 2.1	81.0	63.5	+17.5%
FrontierSWE	仅比 Opus 4.8 低 1%	—	超过 GPT-5.5

GLM-5.2 官方 benchmark 跑分对比：GLM-5.2 vs GLM-5.1 vs Claude Opus 4.8 vs GPT-5.5 vs Gemini — GLM-5.2 官方 benchmark：5 个模型在 8 项基准上的跑分对比，来源 github.com/zai-org/GLM-5（MIT 开源仓库）

来源：Z.ai 官方博客、VentureBeat 报道

值得注意的是，智谱在发布当天没有放出完整的 benchmark 跑分表，主打"先让你用上"的策略。上面这些数字来自官方博客和第三方报道，实际表现建议自行验证。

3. MIT 开源：无地域限制的技术平权

GLM-5.2 采用 MIT 协议开源，无地域限制。这意味着全球开发者都可以免费使用、修改、商用。在当前闭源模型主导的格局下，一个性能逼近 Opus 4.8 的开源模型，对想自建、想私有化部署的团队意义重大。

GLM-5.2 官方真实世界任务 benchmark：长程任务表现对比 — GLM-5.2 官方真实世界任务 benchmark：长程工程任务表现对比，来源 github.com/zai-org/GLM-5

本地运行需要约 256GB 内存（参考腾讯新闻报道），对硬件要求不低。但通过 API 调用就没有这个门槛。

二、它值多少钱？实时价格

GLM-5.2 官方定价是输入 $1.40/百万 tokens、输出 $4.40/百万 tokens——约为 GPT-5.5 的六分之一。下面是 QuickRouter 控制台的实时价格（人民币，充值比例 ¥1 = $1）。

实时价格 · glm-5.2

人民币计价 · 充值比例 ¥1 = $1 · 数据来自 QuickRouter 控制台

国内直连可用

按官方计费规则，人民币充值，无需海外信用卡。查看完整价格表 →

为了直观对比 GLM-5.2 的性价比，这里是它和前代 GLM-5.1、以及闭源旗舰的横向对比：

GLM-5.2 / GLM-5.1 / Claude Opus 4.8 价格对比

人民币 · 每 100 万 tokens · 充值比例 ¥1 = $1 · 数据来自 QuickRouter 控制台

模型	厂商	类型	输入	输出
glm-5.2	—	—	—	—
glm-5.1	—	—	—	—
claude-opus-4-8	—	—	—	—

省钱要点

GLM-5.2 支持 prompt caching——重复的长上下文（项目代码、系统提示）会被缓存，命中后输入价格大幅降低。如果你的任务是"反复读同一个大仓库"，开启 caching 能省下一大笔。具体折扣以控制台实时显示为准。

三、国内怎么调用？

4 步接入，几分钟跑通第一次调用：

4 步跑通 · GLM-5.2

兼容 OpenAI SDK 与常用工具，国内直连

免费开始 →

注册账号

Google 或 GitHub 账号直接登录

复制 API Key

控制台创建令牌即可使用

配置 Base URL

兼容 OpenAI SDK 与常用工具

首次调用成功

一个 Key 调用全球 500+ 大模型

quickrouter_start.py

Ready

from openai import OpenAI

client = OpenAI(
  api_key="YOUR_API_KEY",
  base_url="https://api.quickrouter.ai"
)

response = client.chat.completions.create(
  model="glm-5.2",
  messages=[{"role": "user", "content": "你好"}]
)

print(response.choices[0].message.content)

调用成功

输出：你好！我是 GLM-5.2，有什么可以帮你？

能力总览：六维评分与雷达图

把 GLM 5.2 与上一代 GLM 4.6 放在六个维度上横向对比，能力差异一目了然：

测评点	GLM 5.2	GLM 4.6
推理	★★★★☆A 级	★★★★☆A 级
代码	★★★★½S 级	★★★★☆A 级
数学	★★★★½S 级	★★★★☆A 级
多模态	★★★★½S 级	★★★★☆A 级
长上下文	★★★★½S 级	★★★★☆A 级
工具调用	★★★★☆A 级	★★★★☆A 级

能力维度评分（5 星制，依据官方公布的基准成绩归一化）。来源：各厂商官方发布，非本站实测

GLM 5.2 能力雷达（vs GLM 4.6）

GLM 5.2

GLM 4.6

六维能力对比，实线为 GLM 5.2，虚线为 GLM 4.6。来源：基于官方公布基准归一化，非本站实测