新品3 分钟阅读

Kimi K2.5 解读:开源 ~1T 参数,视觉 Agent 与 100 子智能体调度

基于 Moonshot 官方发布与公开评测,解读 Kimi K2.5——约 1T 参数开源、视觉 Agent 智能体(Agent Swarm 最多 100 子智能体)、256K 上下文、AIME 2025 96.1%、HLE 50.2%。附 QuickRouter 实时价格与国内直连接入。

Moonshot(月之暗面)在 2026 年 1 月交出的答卷是 Kimi K2.5:一个约 1 万亿参数的开源模型,主打视觉智能体(Visual Agentic Intelligence),能调度最多 100 个子智能体协同完成任务。

说明

本文的能力描述来自 Moonshot 官方发布与公开第三方评测,非本站实测

一、Kimi K2.5 在卷什么?官方公布的三件事

根据 Moonshot 官方发布(2026-01-27),升级重点可以归纳成三件事。

1. 约 1T 参数开源 + 256K 上下文

约 1 万亿参数的开源模型,支持 256K 上下文窗口。

2. 视觉智能体(Visual Agentic Intelligence)

支持 Agent Swarm,可以调度最多 100 个子智能体并行执行任务。

3. 推理与工程跑分领先

基准Kimi K2.5
AIME 202596.1%
HLE50.2%
SWE-Bench顶级梯队

来源:Moonshot 官方发布,2026-01

Kimi K2 系列官方 benchmark:8 项任务对比,来源 github.com/MoonshotAI/Kimi-K2
Kimi K2 系列官方 benchmark:8 项任务对比,来源 github.com/MoonshotAI/Kimi-K2

二、Kimi K2.5 比 K2 强在哪?

案例 1:推理与数学

对比维度Kimi K2.5Kimi K2GLM-5.2
AIME 202596.1%较低较高
HLE50.2%较低中等

来源:Moonshot 官方发布,2026-01

案例 2:工程与智能体调度

对比维度Kimi K2.5Kimi K2
SWE-Bench顶级梯队中等
视觉智能体支持较弱
子智能体调度Agent Swarm,最多 100 个

三、它值多少钱?实时价格

实时价格 · kimi-k2.5

人民币计价 · 充值比例 ¥1 = $1 · 数据来自 QuickRouter 控制台

国内直连可用

按官方计费规则,人民币充值,无需海外信用卡。查看完整价格表 →

Kimi K2.5 / K2 / GLM-5.2 价格对比

人民币 · 每 100 万 tokens · 充值比例 ¥1 = $1 · 数据来自 QuickRouter 控制台

模型厂商类型输入输出
kimi-k2.5
kimi-k2
glm-5.2

四、国内怎么调用?

4 步跑通 · Kimi K2.5

兼容 OpenAI SDK 与常用工具,国内直连

免费开始 →
01

注册账号

Google 或 GitHub 账号直接登录

02

复制 API Key

控制台创建令牌即可使用

03

配置 Base URL

兼容 OpenAI SDK 与常用工具

04

首次调用成功

一个 Key 调用全球 500+ 大模型

quickrouter_start.py
Ready
from openai import OpenAI

client = OpenAI(
  api_key="YOUR_API_KEY",
  base_url="https://api.quickrouter.ai"
)

response = client.chat.completions.create(
  model="kimi-k2.5",
  messages=[{"role": "user", "content": "你好"}]
)

print(response.choices[0].message.content)
调用成功

输出:你好!我是 Kimi K2.5,有什么可以帮你?

能力总览:六维评分与雷达图

把 Kimi K2.5 与上一代 Kimi K2 放在六个维度上横向对比,能力差异一目了然:

测评点Kimi K2.5Kimi K2
推理
★★★★☆A 级
★★★★☆A 级
代码
★★★★½S 级
★★★★☆A 级
数学
★★★★☆A 级
★★★★☆A 级
多模态
★★★★☆A 级
★★★★☆A 级
长上下文
★★★★½S 级
★★★★½S 级
工具调用
★★★★☆A 级
★★★★☆A 级

能力维度评分(5 星制,依据官方公布的基准成绩归一化)。来源:各厂商官方发布,非本站实测

Kimi K2.5 能力雷达(vs Kimi K2)
20406080100推理代码数学多模态长上下文工具调用
Kimi K2.5
Kimi K2

六维能力对比,实线为 Kimi K2.5,虚线为 Kimi K2。来源:基于官方公布基准归一化,非本站实测

能力总览:六维评分与雷达图

把 Kimi K2.5 与上一代 Kimi K2 放在六个维度上横向对比,能力差异一目了然:

测评点Kimi K2.5Kimi K2
推理
★★★★☆A 级
★★★★☆A 级
代码
★★★★½S 级
★★★★☆A 级
数学
★★★★☆A 级
★★★★☆A 级
多模态
★★★★☆A 级
★★★★☆A 级
长上下文
★★★★½S 级
★★★★½S 级
工具调用
★★★★☆A 级
★★★★☆A 级

能力维度评分(5 星制,依据官方公布的基准成绩归一化)。来源:各厂商官方发布,非本站实测

Kimi K2.5 能力雷达(vs Kimi K2)
20406080100推理代码数学多模态长上下文工具调用
Kimi K2.5
Kimi K2

六维能力对比,实线为 Kimi K2.5,虚线为 Kimi K2。来源:基于官方公布基准归一化,非本站实测

五、该不该用它?

你的场景推荐理由
高难度推理 / 数学Kimi K2.5AIME 96.1%、HLE 50.2%
多步 Agent / 批量并行Kimi K2.5Agent Swarm,最多 100 子智能体
视觉智能体Kimi K2.5主打视觉 agentic 能力
超长上下文Kimi K2.5256K 上下文 + 大参数

信息来源:本文能力描述来自 Moonshot 官方发布及公开评测,非本站实测。价格数据为发布当日(2026-01-29)QuickRouter 控制台快照,最新价格请以控制台价格页为准。

#Kimi K2.5#Moonshot#开源模型#Agent#国内直连

继续阅读

现在免费试用,3 分钟完成第一次 API 调用

注册即送 $0.2 体验额度,复制 API Key 和 Base URL 后即可开始测试。

免费试用