新品6 分钟阅读

GLM-5.2 解读:最强开源模型,国产模型离 Claude Opus 只差 1%

基于智谱官方发布与公开评测,解读 GLM-5.2——专注 Coding 与长程任务的 MIT 开源模型,FrontierSWE 仅比 Opus 4.8 低 1%,成本却只有 GPT-5.5 的六分之一。附 QuickRouter 实时价格与国内直连接入。

开源模型和闭源之间的差距,一直是大模型圈最被关心的问题。智谱在 2026 年 6 月给出的答案是 GLM-5.2——一个 MIT 协议开源、专注 Coding 与长程任务、号称"排名最高的开源模型"的新版本。

最让人意外的是一组对比:在 FrontierSWE(测试 AI 能否像软件工程师一样完成技术项目的基准)上,GLM-5.2 仅比 Claude Opus 4.8 低 1%,反而超过了 GPT-5.5。而它的 API 价格只有 GPT-5.5 的六分之一

这篇文章基于智谱官方发布与公开评测,解读 GLM-5.2 到底强在哪、开源意味着什么、以及国内开发者怎么用、要花多少钱。

说明

本文的能力描述来自智谱官方发布与公开第三方评测,非本站实测。涉及的能力结论均标注来源,价格数据为 QuickRouter 控制台实时值。建议你用注册赠送的额度,拿自己的真实任务验证。

一、GLM-5.2 在卷什么?官方公布的三件事

根据 智谱官方发布,GLM-5.2 的升级重点可以归纳成三件事。

1. Solid 1M:100 万 token 无损上下文

GLM-5.2 实现了 Solid 1M——100 万 token 的无损上下文窗口。官方强调这"不是简单扩展上下文长度",而是针对长程 Coding Agent 场景做了数月强化训练,覆盖大规模实现、自动化研究、性能优化等任务。

这对开发者意味着什么?以前让模型读一个超长代码仓库或一份巨型文档,模型会"读到后面忘了前面"。GLM-5.2 的 100 万 token 上下文让它能真正处理整个项目级别的任务,而不只是单个文件。

2. Coding 与长程任务的代际提升

GLM-5.2 重点强化了编程能力。从公开 benchmark 看:

基准GLM-5.2GLM-5.1提升幅度
Terminal-Bench 2.181.063.5+17.5%
FrontierSWE仅比 Opus 4.8 低 1%超过 GPT-5.5
GLM-5.2 官方 benchmark 跑分对比:GLM-5.2 vs GLM-5.1 vs Claude Opus 4.8 vs GPT-5.5 vs Gemini
GLM-5.2 官方 benchmark:5 个模型在 8 项基准上的跑分对比,来源 github.com/zai-org/GLM-5(MIT 开源仓库)

来源:Z.ai 官方博客VentureBeat 报道

值得注意的是,智谱在发布当天没有放出完整的 benchmark 跑分表,主打"先让你用上"的策略。上面这些数字来自官方博客和第三方报道,实际表现建议自行验证。

3. MIT 开源:无地域限制的技术平权

GLM-5.2 采用 MIT 协议开源,无地域限制。这意味着全球开发者都可以免费使用、修改、商用。在当前闭源模型主导的格局下,一个性能逼近 Opus 4.8 的开源模型,对想自建、想私有化部署的团队意义重大。

GLM-5.2 官方真实世界任务 benchmark:长程任务表现对比
GLM-5.2 官方真实世界任务 benchmark:长程工程任务表现对比,来源 github.com/zai-org/GLM-5

本地运行需要约 256GB 内存(参考腾讯新闻报道),对硬件要求不低。但通过 API 调用就没有这个门槛。

二、它值多少钱?实时价格

GLM-5.2 官方定价是输入 $1.40/百万 tokens、输出 $4.40/百万 tokens——约为 GPT-5.5 的六分之一。下面是 QuickRouter 控制台的实时价格(人民币,充值比例 ¥1 = $1)。

实时价格 · glm-5.2

人民币计价 · 充值比例 ¥1 = $1 · 数据来自 QuickRouter 控制台

国内直连可用

按官方计费规则,人民币充值,无需海外信用卡。查看完整价格表 →

为了直观对比 GLM-5.2 的性价比,这里是它和前代 GLM-5.1、以及闭源旗舰的横向对比:

GLM-5.2 / GLM-5.1 / Claude Opus 4.8 价格对比

人民币 · 每 100 万 tokens · 充值比例 ¥1 = $1 · 数据来自 QuickRouter 控制台

模型厂商类型输入输出
glm-5.2
glm-5.1
claude-opus-4-8

省钱要点

GLM-5.2 支持 prompt caching——重复的长上下文(项目代码、系统提示)会被缓存,命中后输入价格大幅降低。如果你的任务是"反复读同一个大仓库",开启 caching 能省下一大笔。具体折扣以控制台实时显示为准。

三、国内怎么调用?

4 步接入,几分钟跑通第一次调用:

4 步跑通 · GLM-5.2

兼容 OpenAI SDK 与常用工具,国内直连

免费开始 →
01

注册账号

Google 或 GitHub 账号直接登录

02

复制 API Key

控制台创建令牌即可使用

03

配置 Base URL

兼容 OpenAI SDK 与常用工具

04

首次调用成功

一个 Key 调用全球 500+ 大模型

quickrouter_start.py
Ready
from openai import OpenAI

client = OpenAI(
  api_key="YOUR_API_KEY",
  base_url="https://api.quickrouter.ai"
)

response = client.chat.completions.create(
  model="glm-5.2",
  messages=[{"role": "user", "content": "你好"}]
)

print(response.choices[0].message.content)
调用成功

输出:你好!我是 GLM-5.2,有什么可以帮你?

能力总览:六维评分与雷达图

把 GLM 5.2 与上一代 GLM 4.6 放在六个维度上横向对比,能力差异一目了然:

测评点GLM 5.2GLM 4.6
推理
★★★★☆A 级
★★★★☆A 级
代码
★★★★½S 级
★★★★☆A 级
数学
★★★★½S 级
★★★★☆A 级
多模态
★★★★½S 级
★★★★☆A 级
长上下文
★★★★½S 级
★★★★☆A 级
工具调用
★★★★☆A 级
★★★★☆A 级

能力维度评分(5 星制,依据官方公布的基准成绩归一化)。来源:各厂商官方发布,非本站实测

GLM 5.2 能力雷达(vs GLM 4.6)
20406080100推理代码数学多模态长上下文工具调用
GLM 5.2
GLM 4.6

六维能力对比,实线为 GLM 5.2,虚线为 GLM 4.6。来源:基于官方公布基准归一化,非本站实测

能力总览:六维评分与雷达图

把 GLM 5.2 与上一代 GLM 4.6 放在六个维度上横向对比,能力差异一目了然:

测评点GLM 5.2GLM 4.6
推理
★★★★☆A 级
★★★★☆A 级
代码
★★★★½S 级
★★★★☆A 级
数学
★★★★½S 级
★★★★☆A 级
多模态
★★★★½S 级
★★★★☆A 级
长上下文
★★★★½S 级
★★★★☆A 级
工具调用
★★★★☆A 级
★★★★☆A 级

能力维度评分(5 星制,依据官方公布的基准成绩归一化)。来源:各厂商官方发布,非本站实测

GLM 5.2 能力雷达(vs GLM 4.6)
20406080100推理代码数学多模态长上下文工具调用
GLM 5.2
GLM 4.6

六维能力对比,实线为 GLM 5.2,虚线为 GLM 4.6。来源:基于官方公布基准归一化,非本站实测

四、该不该用它?

基于官方数据和公开评测,给你一个判断框架:

你的场景推荐理由
编程/Coding 任务(尤其长程)GLM-5.2Coding 基准逼近 Opus 4.8,价格只有六分之一
超长上下文任务(整个仓库/巨本文档)GLM-5.2100 万 token 无损上下文
成本敏感的高频调用GLM-5.2开源模型定价低,性价比极高
需要私有化/本地部署GLM-5.2MIT 开源,无地域限制
需要零幻觉、最高可靠性Claude Opus 4.8闭源旗舰在对齐/诚实度上仍领先
通用对话、创意写作看预算GLM-5.2 够用且便宜,Opus 更稳

一句话总结:如果你的核心诉求是"用更少的钱跑更多的编程/长程任务",GLM-5.2 是目前开源阵营的最佳选择。它在 Coding 上离 Opus 只差 1%,成本却差了几个数量级。但如果你要的是极致可靠性(零幻觉、最高对齐),闭源旗舰仍有优势。

注册 QuickRouter 后送的免费额度,足够你拿自己的真实编程任务验证上面的判断。

信息来源:本文能力描述来自 智谱官方发布GitHub 开源仓库VentureBeat 等公开报道,非本站实测。价格数据为发布当日(2026-06-15)QuickRouter 控制台快照,最新价格请以控制台价格页为准。

#GLM-5.2#智谱#开源模型#编程#国内直连

继续阅读

现在免费试用,3 分钟完成第一次 API 调用

注册即送 $0.2 体验额度,复制 API Key 和 Base URL 后即可开始测试。

免费试用