MiniMax 又发新模型了——这次叫 M3,定位是「Coding & Agentic Frontier」,1M 上下文,原生多模态。
官方说法是:「第一个把三项前沿能力统一在一个模型里的开源模型」。
数据看起来很猛,今天把关键信息整理出来。
一、M3 的核心参数
基础配置
|
|
|
|
|---|---|---|
| 上下文窗口 |
|
|
| 处理速度 |
|
|
| 输入价格 |
|
|
| 混合价格(含缓存) | $0.06/M |
|
$0.06/M 是什么概念?官方对比图显示,业界 SOTA(Opus 级别)平均 $0.9+/M——M3 便宜了 15 倍。
模型 ID(Pi Agent 可用)
Pi Agent 已支持 MiniMax M3,在 pi.dev/models 可以看到:
|
|
|
|
|
|---|---|---|---|
MiniMax-M3 |
|
|
|
二、测试数据(来源:minimax.io 官方页面)
M3 的 benchmark 数据来自三个场景:
1. BrowseComp:超越 Opus 4.7
|
|
|
|---|---|
| MiniMax M3 | 83.5 |
|
|
|
M3 在自主浏览和信息检索能力上超过了 Claude Opus 4.7。
2. SWE-bench:持平 Opus 4.7
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
3. PostTrainBench:自主训练排名第三
MiniMax 让 M3 在 12 小时内自主完成四个预训练模型的全流程——数据合成、训练、评测、迭代。
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
| MiniMax M3 | 37.1 | #3 |
超过其他所有模型,包括 DeepSeek V4 等。
4. CUDA 优化:24 小时,9.4 倍加速
官方做了一次极端测试:让 M3 优化 NVIDIA Hopper GPU 上的 FP8 GEMM 内核。
从非可运行的 Triton 骨架代码开始,M3 连续跑了约 24 小时:
- 完成 147 次 benchmark 提交
- 硬件峰值利用率从 7.6% 提升到 71.3%
- 实现了 9.4 倍加速
- 全程无人工干预
三、三项核心能力
1. Coding & Agentic
M3 在软件工程、终端执行、多步推理等主流 benchmark 上达到世界领先水平。
强化学习优化的 Agent 编排能力,支持自适应任务分解和多步推理。相当于给 AI 发了一套完整的工具链——不只是写代码,还能规划、执行、调试。
2. 1M 上下文
官方把 1M 上下文定义为「基础设施」,不只是能力指标。
1M 上下文是长程 Agent 任务、长程 Coding、长视频理解的基础设施。API 保证最低 512K 可用上下文。
3. 原生多模态
M3 是原生多模态模型——整个数据流水线重建,训练数据扩展到 100T+,从零开始多模态训练,文本和视觉语义空间深度对齐。
不是后来加上去的视觉层,是模型的核心能力。
四、开源计划
M3 已在 API 上可用(api.minimax.io/v1/text/chatcompletion_v2),开源版本即将发布:
- HuggingFace
:即将开源 - GitHub
:即将开源 - 私有集群部署
:支持 - 微调
:支持
五、怎么接入?
1. API 调用(最简单)
import requests
url = "https://api.minimax.io/v1/text/chatcompletion_v2"
payload = {
"model": "MiniMax-M3",
"messages": [
{"role": "user", "content": "Hello"}
]
}
headers = {
"Authorization": "Bearer <token>"
}
response = requests.post(url, json=payload, headers=headers)
print(response.text)
2. Pi Agent 直接使用
Pi 已支持 MiniMax M3,设置环境变量即可:
$env:MINIMAX_API_KEY="xxxxxxxxxxxxxxxx"
然后:
/model MiniMax-M3
3. Token Plan(订阅制)
如果你用 Token Plan(订阅),M3 的能力自动生效,价格不变。
支持的 AI Coding 工具:
- Claude Code、Cursor、OpenCode、Codex CLI、Cline、Roocode、Kilo Code、TRAE、Grok CLI
4. MiniMax Code(网页 Agent)
不想写代码,可以直接用 code.minimax.io,基于 M3 的通用 Agent 平台,无需开发,直接体验 Coding Agent、多模态理解等能力。
六、和 DeepSeek V4 对比
既然都写到 MiniMax M3 了,顺便对比一下大家最关心的 DeepSeek V4:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
结论:M3 在 Coding benchmark 上更占优,多模态能力更强;DeepSeek V4 价格更低,适合纯文本场景。
七、适合谁用?
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|





