深夜炸场!小米一口气发布三款 AI 大模型,前 DeepSeek 研究员操刀
如果说 2026 年 3 月有什么科技圈的“悬疑大戏”,那一定是 OpenRouter 平台上突然出现的两个神秘 AI 模型。它们没有名字,只有代号:Hunter Alpha 和 Healer Alpha。没有发布会,没有宣传,却在短短几天内登顶日榜,累计调用量突破 1T tokens。
全网都在猜:这会不会是传说中的 DeepSeek V4?神秘万亿参数模型突袭OpenRouter!是DeepSeek V4还是另有玄机?
谜底揭晓:原来是小米干的!
就在昨晚(3 月 18 日),小米官方终于揭开了谜底——Hunter Alpha 和 Healer Alpha 都是小米 MiMo-V2 系列大模型的内测版本!
更有意思的是,小米 MiMo 大模型的负责人罗福莉,正是 DeepSeek 的前研究员。换句话说,来自 DeepSeek 的她,在小米做了一个让全网以为是 DeepSeek 的模型。这波操作,堪称“神秘营销”的教科书级案例。
小米这次不是简单发布一个模型,而是一口气推出三款,组成了完整的 AI 能力矩阵:
-
MiMo-V2-Pro:旗舰文本基座,专攻推理、规划与工具调用
-
MiMo-V2-Omni:全模态 Agent 基座,能看、能听、能动手
-
MiMo-V2-TTS:语音合成大模型,让 AI 有温度、有情感
这三款模型共同指向一个方向:让 AI 从“会对话”进化为“能完成任务”。
MiMo-V2-Pro:万亿参数,价格却只要竞品的 1/5
先说说这次的主角——MiMo-V2-Pro,也就是那个神秘的 Hunter Alpha。
参数规模惊人
这款模型的总参数量突破 1T(万亿),激活参数为 42B,比前代扩大了约 3 倍。听起来很吓人?但推理效率不降反升,这得益于其创新的混合注意力架构(Hybrid Attention),混合比例从前代的 5:1 提升至 7:1。
更厉害的是,它支持高达 1M(100 万)的超长上下文窗口——这意味着你可以一次性输入一整本书的内容,让 AI 帮你分析。
全球排名第八,国内第二
在全球权威的 Artificial Analysis 智能排行榜上,MiMo-V2-Pro 目前位列全球第八,国内第二。
但小米更强调“实际体感”。在编程 Agent、通用 Agent 和工具调用等维度,MiMo-V2-Pro 已经和 Claude Sonnet 4.6 处于同一梯队。小米内部工程师的深度评测显示,其代码工程能力已接近 Claude Opus 4.6,拥有更出色的系统设计能力。
定价策略:价格屠夫
最让开发者兴奋的是定价:API 价格仅为同级别竞品的 1/5!
-
256K 上下文以内:输入每百万 tokens 1 美元,输出 3 美元
-
1M 上下文范围内:输入 2 美元,输出 6 美元
这个定价策略的信号很明确:小米要用价格优势快速抢占开发者市场。为此,小米还联合 OpenClaw、OpenCode 等五大 Agent 框架团队,提供为期一周的限时免费接口。
MiMo-V2-Omni:能看、能听、还能自己砍价
如果说 MiMo-V2-Pro 是大脑,那么 MiMo-V2-Omni(代号 Healer Alpha)的野心则更大——它要让这个大脑同时拥有眼睛、耳朵和手。
真正的全模态理解
MiMo-V2-Omni 是小米首个在基座层面统一感知与行动的全模态模型,从底层架构就将文本、视觉与音频深度融合。
音频理解是它最具差异化的能力:
-
支持超过 10 小时的连续长音频理解
-
覆盖从环境声分类到多说话人分离的复杂场景
-
综合表现超越 Gemini 3 Pro
图像理解方面:
-
在多学科视觉推理与复杂图表分析上超越 Claude Opus 4.6
-
逼近 Gemini 3 Pro 等顶尖闭源模型水平
真实场景的惊艳表现
最让人印象深刻的是它在实际场景中的表现。结合 OpenClaw 框架,MiMo-V2-Omni 可以像真人一样操控浏览器:
在社交媒体翻阅产品评测
整理购买建议
切换到京东跨店比价
联系客服争取优惠
直到完成下单
遇到多标签页切换、实时交互要求,都能见招拆招。这不是简单的“聊天机器人”,而是真正能替你完成任务的 AI 助手。
办公场景深度整合
MiMo-V2-Omni 已经与金山办公展开合作,接入 WPS 灵犀,支持直接生成:
-
高质量 Word 文档
-
结构化 Excel 表格
-
排版规范的 PDF
-
完整 PPT 演示文稿
覆盖超过 95% 的日常文档类型,这对办公族来说简直是福音。
MiMo-V2-TTS:会打哈欠、会醉酒、还能唱歌
一个完整的 AI Agent,不应该只会思考和行动,它还需要开口说话。MiMo-V2-TTS 正是为了填补这个缺口。
上亿小时语音训练
MiMo-V2-TTS 基于小米自研 Audio Tokenizer 和多码本语音文本联合建模架构,经过上亿小时语音数据的大规模预训练。
这个数据量级意味着模型覆盖了极为丰富的说话风格、口音与场景,这是泛化能力的基础。
多粒度情感控制
MiMo-V2-TTS 支持从整体基调定调到句内局部情绪的多粒度控制,能在同一句话内完成语气转折与情感递变。
模型能够智能识别:
-
标点符号
-
语气词
-
强调标记
并将其自动转化为自然的语音表达,全程无需用户手动标注。
方言与角色扮演
方言支持涵盖:
-
东北话
-
四川话
-
河南话
-
粤语
-
台湾腔
同时具备角色扮演式风格演绎与高质量歌声合成能力,让同一个模型既能说、能演、也能唱。
官方表示,未来 MiMo-V2-TTS 将与 MiMo-V2-Omni 深度融合,让 Agent 不仅能看懂世界、理解世界,更能用富有表现力的声音去讲述这个世界。
AI 才是打通“人车家”生态的那根线
三款模型集中发布,时间节点和产品组合都不是偶然。
罗福莉在声明中坦言,从聊天范式到 Agent 范式的转变发生得太快,“连我们自己都难以置信”。但小米 MiMo 团队其实早有布局——1T 基础模型在数月前就已开始训练。
极端的研发节奏
推动团队加速转向 Agent 方向,源于一个关键时刻。罗福莉第一次体验到复杂 Agent 框架时受到强烈冲击,随即对团队下达了一个有些极端的指令:
“MiMo 团队中,明天对话次数少于 100 次的成员可以辞职。”
这个要求背后,是她对 Agent 范式的坚定判断。结果是,团队的想象力被彻底激发,研究速度随之大幅提升。
生态优势的真正释放
小米长期推进“人车家全生态”战略,通过澎湃 OS 将手机、汽车(SU7 系列)与智能家居设备全面打通。这套生态的物理层面早已互联,但此前缺少一个真正意义上能跨设备理解意图、自主规划并完成任务的智能中枢。
现在:
-
MiMo-V2-Pro 负责推理规划
-
MiMo-V2-Omni 负责多模态感知与执行
-
MiMo-V2-TTS 负责语音表达
三者叠加,构成了驱动整个生态运转的完整 AI 能力栈。
miclaw(小米手机端 AI 智能体)已接入 MiMo 大模型,具备系统级执行能力与“人车家全生态”的深度集成。WPS 灵犀、小米浏览器相继接入,也在说明同一件事:MiMo 不只是一个对话产品,而是正在被嵌入进各类应用场景的基础能力层。
行业反响:从质疑到认可
开发者社区的真实反馈
在 Hunter Alpha 匿名内测期间,调用量最高的几类应用多为编程专用工具,这一数据本身就是对模型能力最直接的市场验证。
在 OpenClaw 框架的 PinchBench 榜单上,Healer Alpha(MiMo-V2-Omni)拿下均分第一,社区用户好评与基准测评结果形成了难得的双向印证。
国际媒体的关注
路透社等国际媒体在揭晓前持续跟踪报道这两个神秘模型,认为它们代表了中国 AI 技术的新突破。当谜底揭晓后,业界普遍认为小米这次“匿名测试”的营销策略非常成功。
与 DeepSeek 的微妙关系
值得一提的是,罗福莉作为 DeepSeek 的前研究员,在小米做出了让全网误认为是 DeepSeek 的模型。这种“师出同门”的技术基因,也让 MiMo-V2 系列在架构设计上继承了 DeepSeek 的一些优秀特质。
但小米显然走出了自己的路——更注重 Agent 能力、更强调生态整合、更激进的价格策略,这些都是小米的独特标签。
如何体验?
目前,MiMo-V2 系列已全面开放:
MiMo-V2-Pro:
-
API 接入:https://platform.xiaomimimo.com
-
官方体验页面:https://aistudio.xiaomimimo.com
-
支持免费体验 MiMo Claw 功能
MiMo-V2-Omni:
-
API 已开放,支持 256K 上下文
-
输入定价:每百万 tokens 0.4 美元
-
输出定价:2 美元
WPS 灵犀体验:
-
访问:lingxi.wps.cn
-
已全面接入 MiMo 能力
写在最后:AI 竞赛进入新阶段
2026 年的 AI 竞赛,已经不再是简单的“参数大战”或“跑分竞赛”。小米这次发布的 MiMo-V2 系列,展现了一个清晰的趋势:
AI 的价值不在于能聊多好,而在于能帮你做多少事。
从对话到 Agent,从单一模态到全模态,从独立应用到生态整合——这才是 AI 技术真正走向实用的方向。
小米凭借其在硬件生态上的深厚积累,加上前 DeepSeek 研究员罗福莉带领的技术团队,正在将 AI 能力深度嵌入到“人车家”的每一个场景中。
当你的小米手机、小米汽车、小米智能家居都由同一个 AI 大脑驱动时,那种无缝衔接的智能体验,或许才是未来生活的真正模样。
而这一切,才刚刚开始。
相关阅读推荐:
17岁高中生震撼AI圈!马斯克点赞的Kimi新架构,把Transformer"旋转90度"
神秘代号"虾骑马"揭晓!智谱发布全球首个"龙虾专用"AI模型
英伟达重磅开源!Nemotron 3 Super:专为AI智能体打造的"超级大脑

