大数跨境

MiniMax M3 重磅发布:1M 上下文、/usr/bin/bash.06/M 混合价格、超越 Opus 4.7 的 Coding 能力

MiniMax M3 重磅发布:1M 上下文、/usr/bin/bash.06/M 混合价格、超越 Opus 4.7 的 Coding 能力 创见AI实验室
2026-06-01
3
导读:MiniMax 又发新模型了——这次叫 M3,定位是「Coding & Agentic Frontier」,1M 上下文,原生多模态。官方说法是:「第一个把三项前沿能力统一在一个模型里的开源模型」。数

MiniMax 又发新模型了——这次叫 M3,定位是「Coding & Agentic Frontier」,1M 上下文,原生多模态。

官方说法是:「第一个把三项前沿能力统一在一个模型里的开源模型」。

数据看起来很猛,今天把关键信息整理出来。


一、M3 的核心参数

基础配置

参数
数值
说明
上下文窗口
1M tokens
API 支持,保证最低 512K
处理速度
100 TPS
比 Opus 快 3 倍
输入价格
$0.30/M
API 直接调用
混合价格(含缓存) $0.06/M
开启自动 Cache 后

$0.06/M 是什么概念?官方对比图显示,业界 SOTA(Opus 级别)平均 $0.9+/M——M3 便宜了 15 倍

模型 ID(Pi Agent 可用)

Pi Agent 已支持 MiniMax M3,在 pi.dev/models 可以看到:

模型 ID
上下文
输入价格
输出价格
MiniMax-M3
1M
$0.30/M
缓存后 $0.06/M

二、测试数据(来源:minimax.io 官方页面)

M3 的 benchmark 数据来自三个场景:

1. BrowseComp:超越 Opus 4.7

模型
得分
MiniMax M3 83.5
Claude Opus 4.7
79.3

M3 在自主浏览和信息检索能力上超过了 Claude Opus 4.7。

2. SWE-bench:持平 Opus 4.7

测试
M3
Opus 4.7
SWE-bench Pro
与 Opus 持平
基准
SWE-bench Verified
与 Opus 持平
基准

3. PostTrainBench:自主训练排名第三

MiniMax 让 M3 在 12 小时内自主完成四个预训练模型的全流程——数据合成、训练、评测、迭代。

模型
得分
排名
Opus 4.7
42.4
#1
GPT-5.5
39.3
#2
MiniMax M3 37.1 #3

超过其他所有模型,包括 DeepSeek V4 等。

4. CUDA 优化:24 小时,9.4 倍加速

官方做了一次极端测试:让 M3 优化 NVIDIA Hopper GPU 上的 FP8 GEMM 内核。

从非可运行的 Triton 骨架代码开始,M3 连续跑了约 24 小时:
- 完成 147 次 benchmark 提交
- 硬件峰值利用率从 7.6% 提升到 71.3%
- 实现了 9.4 倍加速
- 全程无人工干预


三、三项核心能力

1. Coding & Agentic

M3 在软件工程、终端执行、多步推理等主流 benchmark 上达到世界领先水平。

强化学习优化的 Agent 编排能力,支持自适应任务分解和多步推理。相当于给 AI 发了一套完整的工具链——不只是写代码,还能规划、执行、调试。

2. 1M 上下文

官方把 1M 上下文定义为「基础设施」,不只是能力指标。

1M 上下文是长程 Agent 任务、长程 Coding、长视频理解的基础设施。API 保证最低 512K 可用上下文。

3. 原生多模态

M3 是原生多模态模型——整个数据流水线重建,训练数据扩展到 100T+,从零开始多模态训练,文本和视觉语义空间深度对齐。

不是后来加上去的视觉层,是模型的核心能力。


四、开源计划

M3 已在 API 上可用(api.minimax.io/v1/text/chatcompletion_v2),开源版本即将发布:

  • HuggingFace
    :即将开源
  • GitHub
    :即将开源
  • 私有集群部署
    :支持
  • 微调
    :支持

五、怎么接入?

1. API 调用(最简单)

import requests

url = "https://api.minimax.io/v1/text/chatcompletion_v2"

payload = {
    "model": "MiniMax-M3",
    "messages": [
        {"role": "user", "content": "Hello"}
    ]
}
headers = {
    "Authorization": "Bearer <token>"
}

response = requests.post(url, json=payload, headers=headers)
print(response.text)

2. Pi Agent 直接使用

Pi 已支持 MiniMax M3,设置环境变量即可:

$env:MINIMAX_API_KEY="xxxxxxxxxxxxxxxx"

然后:

/model MiniMax-M3

3. Token Plan(订阅制)

如果你用 Token Plan(订阅),M3 的能力自动生效,价格不变。

支持的 AI Coding 工具:
- Claude Code、Cursor、OpenCode、Codex CLI、Cline、Roocode、Kilo Code、TRAE、Grok CLI

4. MiniMax Code(网页 Agent)

不想写代码,可以直接用 code.minimax.io,基于 M3 的通用 Agent 平台,无需开发,直接体验 Coding Agent、多模态理解等能力。


六、和 DeepSeek V4 对比

既然都写到 MiniMax M3 了,顺便对比一下大家最关心的 DeepSeek V4:

对比项
MiniMax M3
DeepSeek V4
上下文
1M
1M
输入价格
$0.30/M
$0.14/M
混合价格
$0.06/M
-
多模态
✅ 原生
❌ 文本为主
SWE-bench
持平 Opus 4.7
未公布
PostTrainBench
37.1 (#3)
-
开源
即将

结论:M3 在 Coding benchmark 上更占优,多模态能力更强;DeepSeek V4 价格更低,适合纯文本场景。


七、适合谁用?

场景
推荐
超长代码审查(>100K tokens)
M3(1M 上下文)
多模态任务(代码+截图+文档)
M3(原生多模态)
复杂 Agent 任务(多步规划)
M3(Coding & Agentic)
预算有限、纯文本处理
DeepSeek V4($0.14/M)
不想折腾、直接用
Token Plan(订阅)
精选系列




【声明】内容源于网络
0
0
创见AI实验室
创见AI实验室,我们不只是介绍工具,我们共同创造工作方式的未来。
内容 147
粉丝 0
创见AI实验室 创见AI实验室,我们不只是介绍工具,我们共同创造工作方式的未来。
总阅读20
粉丝0
内容147