新品5 分钟阅读

MiniMax M3 解读:第一个把 frontier coding、1M 上下文、原生多模态揉进同一个开源模型

基于 MiniMax 官方发布与公开评测,解读 MiniMax M3——MSA 稀疏注意力架构、1M 上下文、原生多模态 + agentic coding + computer-use,SWE-Bench Pro 跑分据称超越 GPT-5.5。附 QuickRouter 实时价格与国内直连接入。

2026 年的大模型赛道,大多在卷一个维度:要么卷便宜、要么卷上下文、要么卷多模态。MiniMax 在 6 月 1 日发布的 M3 给出的赌注不太一样——它想同时把三件事做到 frontier 水平:前沿的编程能力、100 万 token 的上下文窗口、原生多模态。

这是官方自称的"第一个把 frontier coding + 1M 上下文 + 原生多模态揉进同一个开源模型"的尝试。更激进的,是它采用了全新的 MSA(MiniMax Sparse Attention)架构,并据公开评测称其在 SWE-Bench Pro 上的跑分超过了 GPT-5.5

说明

本文的能力描述来自 MiniMax 官方发布与公开第三方评测,非本站实测。其中 SWE-Bench Pro 超越 GPT-5.5 的说法,部分媒体指出尚待独立复测验证,请留意甄别。

一、MiniMax M3 在卷什么?官方公布的三件事

1. MSA:MiniMax Sparse Attention 新架构

M3 最核心的工程亮点是全新的 MSA(MiniMax Sparse Attention)架构。传统 Transformer 注意力机制是"全连接"的,上下文越长计算量呈平方级膨胀。MSA 的思路是稀疏化:只让每个 token 关注真正需要关联的部分,从而在超长上下文下把计算开销压下来。

正是这套架构让 M3 能在不爆炸的算力预算下跑通 100 万 token 上下文

MiniMax M3 官方 MSA 稀疏注意力架构图
MiniMax M3 的 MSA(MiniMax Sparse Attention)架构,来源 minimax.io/blog/minimax-m3

2. 第一个"三位一体"的开源模型

能力维度M3 的定位
Frontier 编程接近闭源旗舰的 agentic coding 能力
1M 上下文100 万 token 原生窗口(MSA 支撑)
原生多模态图文输入,非外挂拼接

3. Agentic coding + computer-use

M3 不仅会写代码,还具备操作计算机界面(computer-use)的潜力——看截图、定位元素、执行点击/输入。

来源:MiniMax 官方博客

二、实测案例:公开评测数据

案例 1:SWE-Bench Pro

基准M3(公开评测)对比备注
SWE-Bench Pro据称超越 GPT-5.5领先闭源旗舰部分媒体指出尚待独立复测

来源:公开第三方评测,2026-06

MiniMax M3 官方 benchmark 跑分对比
MiniMax M3 官方 benchmark 跑分,来源 minimax.io/blog/minimax-m3

案例 2:长上下文

任务类型1M 上下文的典型价值
整仓库代码理解单次读入完整项目,跨文件追踪依赖
超长文档总结减少切分检索,降低信息丢失
多轮 Agent 上下文累积长程 agent 任务不掉链子

案例 3:多模态 + computer-use

能力组合典型场景
多模态 + agentic coding看设计稿/截图 → 输出对应代码
多模态 + computer-use自动化界面操作、截图诊断

关于跑分的补充

computer-use 类能力在生产环境中的可靠性通常远低于跑分所示,建议优先用真实任务验证。

三、价格

实时价格 · MiniMax-M3

人民币计价 · 充值比例 ¥1 = $1 · 数据来自 QuickRouter 控制台

国内直连可用

按官方计费规则,人民币充值,无需海外信用卡。查看完整价格表 →

MiniMax M3 / M2.7 / GLM-5.2 价格对比

人民币 · 每 100 万 tokens · 充值比例 ¥1 = $1 · 数据来自 QuickRouter 控制台

模型厂商类型输入输出
MiniMax-M3
MiniMax-M2.7
glm-5.2

怎么选更省钱

M3 和 M2.7 定价档位相同。如果不需要 1M 上下文或多模态,前代 M2.7 更划算。

四、国内怎么调用?

4 步跑通 · MiniMax M3

兼容 OpenAI SDK 与常用工具,国内直连

免费开始 →
01

注册账号

Google 或 GitHub 账号直接登录

02

复制 API Key

控制台创建令牌即可使用

03

配置 Base URL

兼容 OpenAI SDK 与常用工具

04

首次调用成功

一个 Key 调用全球 500+ 大模型

quickrouter_start.py
Ready
from openai import OpenAI

client = OpenAI(
  api_key="YOUR_API_KEY",
  base_url="https://api.quickrouter.ai"
)

response = client.chat.completions.create(
  model="MiniMax-M3",
  messages=[{"role": "user", "content": "你好"}]
)

print(response.choices[0].message.content)
调用成功

输出:你好!我是 MiniMax M3,有什么可以帮你?

能力总览:六维评分与雷达图

把 MiniMax M3 与上一代 MiniMax M2 放在六个维度上横向对比,能力差异一目了然:

测评点MiniMax M3MiniMax M2
推理
★★★★☆A 级
★★★★☆A 级
代码
★★★★☆A 级
★★★★☆A 级
数学
★★★★☆A 级
★★★★☆A 级
多模态
★★★★☆A 级
★★★½☆B 级
长上下文
★★★★½S 级
★★★★½S 级
工具调用
★★★★☆A 级
★★★½☆B 级

能力维度评分(5 星制,依据官方公布的基准成绩归一化)。来源:各厂商官方发布,非本站实测

MiniMax M3 能力雷达(vs MiniMax M2)
20406080100推理代码数学多模态长上下文工具调用
MiniMax M3
MiniMax M2

六维能力对比,实线为 MiniMax M3,虚线为 MiniMax M2。来源:基于官方公布基准归一化,非本站实测

能力总览:六维评分与雷达图

把 MiniMax M3 与上一代 MiniMax M2 放在六个维度上横向对比,能力差异一目了然:

测评点MiniMax M3MiniMax M2
推理
★★★★☆A 级
★★★★☆A 级
代码
★★★★☆A 级
★★★★☆A 级
数学
★★★★☆A 级
★★★★☆A 级
多模态
★★★★☆A 级
★★★½☆B 级
长上下文
★★★★½S 级
★★★★½S 级
工具调用
★★★★☆A 级
★★★½☆B 级

能力维度评分(5 星制,依据官方公布的基准成绩归一化)。来源:各厂商官方发布,非本站实测

MiniMax M3 能力雷达(vs MiniMax M2)
20406080100推理代码数学多模态长上下文工具调用
MiniMax M3
MiniMax M2

六维能力对比,实线为 MiniMax M3,虚线为 MiniMax M2。来源:基于官方公布基准归一化,非本站实测

五、该不该用它?

你的场景推荐理由
长程编程 + 整仓库理解MiniMax M31M 上下文 + MSA
多模态驱动编程MiniMax M3原生多模态 + agentic coding
纯编程、不需超长上下文M2.7 或 GLM-5.2价格同档,能力够用
需要最高可靠性/零幻觉闭源旗舰开源模型在对齐度上仍有差距

信息来源:本文能力描述来自 MiniMax 官方发布及公开第三方评测,非本站实测。其中 SWE-Bench Pro 超越 GPT-5.5 的结论,部分媒体指出尚待独立复测验证。价格数据为发布当日(2026-06-03)QuickRouter 控制台快照,最新价格请以控制台价格页为准。

#MiniMax M3#MiniMax#开源模型#长上下文#国内直连

继续阅读

现在免费试用,3 分钟完成第一次 API 调用

注册即送 $0.2 体验额度,复制 API Key 和 Base URL 后即可开始测试。

免费试用