一、2026年以来发布最新国产大模型核心参数与场景对比
2026年以来,国产头部大模型集中迭代,核心聚焦稀疏MoE架构与成本优化,具体核心指标如下:
1. MiniMax M2.5:稀疏MoE架构,总参2300亿/活跃参100亿,上下文窗口205K;单次100万tokens成本1.2-2.4美元,延迟低;适配高频API调用、实时交互与智能体开发。
2. GLM-5:搭载slime RL框架的MoE架构,总参7440亿/活跃参400亿,上下文窗口200K;单次100万tokens成本3.2-4.6美元,延迟最低;主打日常编码、长时后台任务。
3. Kimi K2.5:原生多模态大规模MoE架构,总参1万亿/活跃参320亿,上下文窗口256K;单次100万tokens成本2.5美元,延迟低;适用于办公协作、多智能体与并行数据提取。
4. Qwen 3.5:门控Delta网络+稀疏MoE架构,总参3970亿/活跃参170亿,上下文窗口262K;单次100万tokens成本1.0-2.6美元,延迟中等;核心场景为检索增强生成(RAG)与全球语言覆盖。

二、大模型应用层市场格局:2C+2B双轨渗透
大模型应用层按场景分为四大板块,实现2C个人端与2B企业端的全面覆盖:
(一)核心应用场景分布
1. 生产力场景(2C):ChatGPT、DeepSeek、Claude、豆包、Perplexity等;(2B):OpenAI、Anthropic、MiniMax、Azure、Google Cloud等提供企业级服务。
2. 娱乐场景(2C):主打AI互动娱乐类应用;(2B):OpenEvidence、Harvey、AlphaSense等聚焦专业领域效率提升。
3. 视觉生成场景(2C):Sora、Gemini、Hailuo AI、Midjourney等;(2B):Runway、MiniMax、Synthesia等提供商用生成能力。
4. 音频生成场景(2C):ElevenLabs、Suno、HeyGen等;(2B):OpenAI、MiniMax、Cartesia等布局企业级音频解决方案。
(二)技术层支撑
模型层分为文本、视觉、音频三大方向,为应用层提供核心技术底座;基础设施层、模型层、应用层形成完整产业闭环。

三、中国AI企业全栈布局与商业数据对比
(一)梯队化竞争格局
1. 互联网巨头(BAT+字节):全栈布局(芯片+算力+模型+应用),覆盖To B+To C全客群,核心收入来源为MaaS、云服务、订阅与API费用。
- 阿里巴巴:FY25总营收1033亿元,FY26E达1140亿元;毛利率FY25E 40%、FY26E 41%;旗舰模型Qwen3-Max(闭源),其余开源+闭源并行。
- 腾讯:CY24总营收660亿元,CY25E 752亿元;毛利率/净利率CY24均为34%,CY25E保持同等水平;旗舰模型HY2.0(闭源),部分家族模型开源+闭源。
- 字节跳动:To C聊天机器人日活tokens使用量行业第一,AI业务覆盖全栈,营收数据未披露;旗舰模型豆包1.6、Seed1.8(均闭源)。
2. 独立AI厂商(MiniMax、智谱AI、Moonshot AI):聚焦模型+应用层,以MaaS、订阅、API为核心收入。
- MiniMax:全球化布局,CY24营收3100万美元(约20亿元),CY25E 7500万美元(约50亿元);营收同比CY24 +782%、CY25E +146%;毛利率CY24 12%、CY25E 21%(剔除Talkie/Ingye后GPM超50%);前五大客户收入占比22%(9M25);最新模型M2.1(开源多模态)、M2.5(闭源)。
- 智谱AI:聚焦中国市场,CY24营收3亿元,1H25 2亿元;营收同比CY24 +151%、1H25 +326%;毛利率CY24 56%、1H25 50%;前五大客户收入占比40%(1H25);最新模型GLM-4.7(开源)。
- Moonshot AI:全球化布局,营收数据未披露;最新模型K2.5(开源)。

(二)产业层级分布
1. 基础设施层:阿里、腾讯、字节、百度、金山云等提供GPU/TPU算力、存储与预训练服务。
2. 模型层:阿里、字节、DeepSeek、MiniMax、腾讯、百度、智谱AI等,提供开源模型微调与MaaS服务。
3. 应用层:BAT、MiniMax、DeepSeek、百度等,将生成式AI集成至面向用户的产品,实现全场景覆盖。

四、全球大模型性价比与性能核心对比(截至2026.02.19)
(一)价格竞争力:国产模型优势显著
MiniMax-M2.5以0.53美元/百万tokens的混合价格,成为全球性价比最高的基础模型之一;对比来看,智谱AI GLM-5为1.6美元、Moonshot AI Kimi K2.5为1.2美元,OpenAI GPT-5.2达4.5美元、Anthropic Claude Opus 4.6为10.0美元。
(二)核心性能指标
1. 智能水平(Artificial Analysis):GLM-5、Gemini 3.1 Pro均为57分,Kimi K2.5 47分,MiniMax M2.5、DeepSeek V3.2均为42分。
2. 每秒中位数tokens:Gemini 3.1 Pro 106,GPT-5.2 83,MiniMax M2.5 58,GLM-5 56。
3. 编码能力(LMArena 2.19榜单):Gemini 3.1 Pro 1500分,Claude Opus 4.6 1505分,国产模型中GLM-5 1455分、Kimi K2.5 1449分、MiniMax M2.5 1402分,与国际头部差距持续缩小。

(三)视频生成模型对比(截至2026.02.05)
国产视频生成模型在定价与性能上实现双重突破,核心代表为MiniMax Hailuo 2.3/02与快手Kling 3.0:
1. 定价优势:MiniMax Hailuo API定价2.8美元/分钟,远低于OpenAI Sora 2 Pro的30美元/分钟;快手Kling 3.0暂未披露定价。
2. 核心性能:
- MiniMax Hailuo:基础模型M2,最高分辨率1080P,最长时长10s,帧率24-30 FPS;文本转视频/图像转视频榜单得分1188/1261;优势为物理仿真、提示词理解、产品一致性与动漫画质。
- 行业对标:Google Veo 3.1定价6美元/分钟,字节Wan 2.6定价9美元/分钟,Runway Gen-4.5定价9.6美元/分钟;国产模型在成本控制与细分场景表现上具备核心竞争力。

五、2026年中国互联网AI核心投资主题
1. 广告技术革新:AI驱动广告预算向ROI导向转移,AEO/GEO策略成为主流,腾讯AIM+、阿里全栈推等产品渗透率持续提升。
2. 模型竞争升级:核心战场转向智能体功能,聚焦编码、统一多模态、3D世界模型、长链智能体能力与低成本架构。
3. C端应用普及:超级APP中To C聊天机器人/全能助手/AI智能体加速渗透,长期将影响APP用户流量格局。
4. 中美模型差距:2025年差距约6个月,2026年将取决于中国企业对下一代芯片的获取能力。
5. 全球化扩张:从开源模式向“开源+闭源”混合模式转型,商业化变现能力持续增强。
6. 推理需求爆发:To C+To B双需求驱动AI推理需求/ tokens使用量激增,带动云收入与数据中心需求高速增长。

六、市场规模与份额核心数据
(一)Tokens使用量(中国市场)
1. 2025年6月整体tokens使用量达30万亿(含云厂商内部使用+企业级外部使用)。
2. 2025上半年:企业级模型tokens使用量10万亿;公有云AI模型tokens使用量约3万亿。
3. 市场份额:
- 整体tokens:阿里18%、字节14%、DeepSeek 10%、其他58%。
- 公有云tokens:字节49%、阿里27%、百度17%、其他7%。

(二)全球市场份额预测
1. 中国AI基础模型全球收入份额:2025年约3.5%,预计2030年提升至9%,呈持续上升趋势。
2. 全球AI视频编辑与生成市场(单位:十亿美元):
- 2025年市场规模约50亿美元,MiniMax Hailuo占1%、快手Kling占5%。
- 2030年市场规模预计达700亿美元,MiniMax Hailuo占5%、快手Kling占7%,国产厂商份额持续扩大。


