作者丨克雷西
头图丨Xiaomi MiMo大模型负责人罗福莉
曾以“Hunter Alpha”代号霸榜OpenRouter调用量榜首的神秘模型,正式揭晓身份——并非GPT或DeepSeek,而是小米全新万亿参数旗舰大模型:MiMo-V2-Pro。
3月19日凌晨,小米官宣MiMo-V2家族三款新模型:Pro、Omni与TTS。
官方明确指出,MiMo-V2-Pro即此前引发热议的Hunter Alpha。
在身份揭晓前,外界猜测纷纭,有人推测为OpenAI新品,亦有观点指向DeepSeek。当确认出自小米时,业内普遍感到意外。
MiMo-V2-Pro参数规模达万亿级,支持百万Token超长上下文,在Artificial Analysis全球智能指数中位列全球第八、国内第二;代码能力超越Claude 4.6 Sonnet,在SWE-bench Verified测试中取得86.7分。
其任务规划与工具调用能力突出,可基于自然语言提示,直接生成含动态背景与升级路线的3D塔防游戏(Three.js实现)。
同期发布的MiMo-V2-Omni(全模态模型)与MiMo-V2-TTS(语音合成模型),同样具备领先实力。
小米三款模型一同亮相
MiMo-V2-Pro核心定位为“真实世界的智能体工作流”,总参数量超1T,激活参数达42B,上下文窗口达1M Token,整体规模约为MiMo-V2-Flash的三倍。
模型采用升级版混合注意力机制(混合比例由5:1提升至7:1),兼顾超大规模与高推理效率;搭配轻量级MTP多Token预测层,可在1M Token上下文中保持高速响应。
为支撑训练与部署,小米AI团队联合北京大学研发统一资源管理系统ARL-Tangram,通过动作级建模与弹性调度算法,将平均动作完成时间缩短4.3分钟,训练耗时最多降低1.5倍,算力与外部资源消耗下降71.2%。
性能方面,MiMo-V2-Pro在多项权威评测中表现亮眼:
- Artificial Analysis全球智能指数:全球第8、国产第2;
- PinchBench(智能体能力):84.0分;
- ClawEval(复杂任务执行):61.5分,全面超越Gemini 3 Pro,逼近Claude Opus 4.6;
- SWE-bench Verified(代码生成):86.7分,超越Claude 4.6 Sonnet。
在OpenRouter平台实测中,MiMo-V2-Pro(Hunter Alpha)调用量登顶:OpenClaw贡献675B Token,Kilo Code与Roo Code分别达50.1B和38.6B Token,验证其在生产环境中的高可靠性。
接入OpenClaw框架实测显示,仅凭一段提示词,MiMo-V2-Pro即可生成具备1990年代复古杂志风格的网页,精准还原排版逻辑与噪点滤镜效果。
MiMo-V2-Omni:全模态感知与行动一体化
MiMo-V2-Omni将图像、视频、音频编码器统一集成于单一主干网络,实现“看、听、读”同步感知,并可直接转化为行动指令。
实测中,该模型可作为自动驾驶视觉大脑提前识别风险;亦可作为通用智能体,在浏览器内自主完成跨平台比价、下单等全流程操作,高效调用工具并精准交互界面。
MiMo-V2-TTS:情感化语音生成
MiMo-V2-TTS支持自然语言控制音色与情绪,能依据上下文自动匹配语气,并自然融入咳嗽、叹气、笑声等拟真细节,显著提升人机交互沉浸感。

身份让龙虾之父也好奇
Hunter Alpha与Healer Alpha于3月11日亮相OpenRouter,随后连续多日霸榜,总调用量迅速突破1T Token,引发全球关注。
“龙虾之父”Peter Steinberger在X平台发帖询问模型背景,侧面印证其影响力之广。
因命名风格与发布路径类似OpenAI惯用策略,初期猜测集中于GPT系列;但鉴于Peter已加入OpenAI,该猜测存疑。
另有线索显示模型宣称“主要使用中文训练”,推动DeepSeek-V4等国产模型猜测升温;而早在3月14日,已有网友在小红书提及小米相关传闻。
此次身份揭晓正值小米新品发布会前夕,被视为技术底座的重要预热。
模型体验地址:


