克雷西 发自 凹非寺
量子位 | 公众号 QbitAI
长期占据OpenRouter调用量榜首的神秘模型Hunter Alpha,正式揭晓身份——并非GPT或DeepSeek,而是小米推出的万亿参数旗舰大模型MiMo-V2-Pro。
3月19日凌晨,小米官宣MiMo-V2家族三款新模型:Pro、Omni与TTS。
官方明确指出,MiMo-V2-Pro即此前以Hunter Alpha代号在OpenRouter平台进行盲测的模型。
此前,外界对Hunter Alpha身份猜测纷纭,从GPT到DeepSeek均有涉及;当确认其归属小米时,引发广泛关注。
MiMo-V2-Pro参数规模达万亿级,支持百万Token长文本,在Artificial Analysis全球智能指数中位列全球第八、国内第二;代码能力超越Claude 4.6 Sonnet,在SWE-bench Verified测试中达86.7分。
该模型可自主规划复杂任务,例如仅凭提示词即可生成含动态背景与升级路线的3D塔防游戏代码(基于Three.js)。
小米三款模型一同亮相
MiMo-V2-Pro以真实世界的智能体工作流为核心设计理念,总参数量超1T,激活参数42B,上下文窗口达1M Token,规模约为MiMo-V2-Flash的三倍。
模型采用升级版混合注意力机制,混合比例由5:1提升至7:1,并集成轻量级MTP多Token预测层,在处理1M Token长上下文时仍保持高推理效率。
为支撑训练与部署,小米联合北京大学研发统一资源管理系统ARL-Tangram,通过动作级公式建模与弹性调度算法,将平均动作完成时间缩短4.3分钟,训练步骤耗时最多减少1.5倍,算力与外部资源消耗降低71.2%。
在权威评测中,MiMo-V2-Pro表现突出:
- Artificial Analysis:国产第二、全球第八;
- PinchBench:84.0分;ClawEval:61.5分,全面超越Gemini 3 Pro,逼近Claude Opus 4.6;
- SWE-bench Verified:86.7分,超越Claude 4.6 Sonnet。
在OpenRouter平台盲测期间,MiMo-V2-Pro调用量登顶:OpenClaw贡献675B Token,Kilo Code与Roo Code分别达50.1B和38.6B Token,验证其生产环境可靠性。
接入OpenClaw框架实测显示,模型可依提示词生成具备1990年代复古杂志风格的网页,精准还原排版与噪点滤镜效果。
MiMo-V2-Omni:全模态智能体基座
MiMo-V2-Omni将图像、视频、音频编码器深度融合于同一主干网络,实现“看、听、读”同步感知,并直接驱动行动。
实测中,它可作为自动驾驶视觉大脑预判风险,亦可在浏览器内自主完成跨平台比价与购物任务,高效调用工具并交互操作界面。
MiMo-V2-TTS:情感化语音合成模型
MiMo-V2-TTS专为智能体赋予自然语音表现力,支持通过自然语言提示词精确控制音色与情绪变化;能根据上下文自动适配语气,并自然融入咳嗽、叹气、笑声等细微语音特征。
身份让龙虾之父也好奇
Hunter Alpha与Healer Alpha于3月11日亮相OpenRouter,调用量迅速突破1T Token,连续多日登顶榜单。
连“龙虾之父”Peter Steinberger也在X平台发帖询问模型细节。
早期猜测集中于OpenAI或DeepSeek:前者因命名风格与试水惯例被高频提及;后者则因模型自述中文训练为主而获推测支持。亦有用户早在3月14日于小红书提及小米关联传闻。
小米选择在新品发布会前夕正式公布模型身份,或意在强化技术底座与产品协同叙事。

