DeepSeek V4 来了：万亿参数开源模型，竟能叫板 GPT-5？- 大数跨境

首页

DeepSeek V4 来了：万亿参数开源模型，竟能叫板 GPT-5？

洞见畏来

2026-04-25

导读：🚀 DeepSeek V4 来了：万亿参数开源模型，竟能叫板 GPT-5？当所有人都以为大模型竞赛已经

当所有人都以为大模型竞赛已经进入尾声，一家中国公司用两张新的王牌，再次改写了游戏规则。

深夜突袭，两张王牌同时亮相

昨晚，AI 圈又热闹了。中国 AI 实验室 DeepSeek 毫无预兆地发布了 V4 系列模型——V4 Flash 和 V4 Pro，分别对应轻量版和旗舰版。这是继去年 V3.2 和 R1 推理模型之后的又一次重大迭代，也是目前开源社区最期待的升级之一。

说到 R1，不少人还记忆犹新。去年年底，DeepSeek 用那款推理模型让整个行业为之一震，连 OpenAI 和 Anthropic 都感受到了压力。当时不少人评价它是"用极低的训练成本，做出了接近顶级闭源模型的效果"。如今 V4 的到来，更像是一次蓄谋已久的全面反攻——不仅要在推理上继续突破，还要在模型规模和综合性能上硬碰硬。

这两个新模型的参数规模堪称恐怖。V4 Pro 总参数量高达 1.6 万亿，是目前世界上最大的开源模型，直接超过了 Moonshot AI 的 Kimi K 2.6（1.1 万亿）和 MiniMax 的 M1（4560 亿）。连自家的 V3.2（6710 亿参数）也被远远甩在身后。轻量版的 V4 Flash 则拥有 2840 亿参数，虽然规模小了不少，但胜在速度够快，适合对延迟敏感的场景。

更关键的是，DeepSeek 在两款模型中都采用了 Mixture-of-Experts（MoE） 架构。简单理解，这个架构就像一家医院里，不需要每次看病都把全院所有科室的专家都叫到一起，而是根据病情只激活相关领域的专家。V4 Pro 虽然坐拥 1.6 万亿参数，但每次推理只激活 490 亿，这样既保持了强大的能力，又避免了资源浪费。MoE 架构还有一个好处——随着模型变大，训练成本的增长速度比传统密集模型慢得多。这也是为什么 DeepSeek 敢于把参数量堆到 1.6 万亿的重要原因。

另外，两个模型的上下文窗口都达到了 100 万 token。这个数字什么概念？意味着你可以直接把一本中等篇幅的书、一份大型代码库或者一套完整的技术文档塞进对话里，模型还能精准理解、准确回答。对于程序员来说，这简直是福音——直接把整个项目的源码丢进去让它分析，不用再一段一段地复制粘贴。

推理能力：终于有资格和顶尖模型坐在一张牌桌上了

DeepSeek 这次最有底气的一点，是它在推理基准测试上的突破。官方宣称 V4 系列已经 "几乎追平了"当前所有顶尖模型，无论开源还是闭源。

旗舰版 V4-Pro-Max 在多项推理测试中，击败了 OpenAI 的 GPT-5.2 和 Google 的 Gemini 3.0 Pro。在编程竞赛类基准测试里，两款 V4 模型的表现甚至与 GPT-5.4 不相上下。要知道，GPT-5.4 可是目前闭源阵营里最顶尖的模型之一，一个开源模型能追到这个水平，说实话已经相当不容易了。

这背后的意义其实比数字本身更重要。过去几年，开源模型和闭源模型之间一直存在一条看不见的鸿沟。GPT-4、Claude、Gemini 这些闭源模型凭借雄厚的算力投入和海量数据，始终保持着明显领先。开源社区虽然热闹，但很多时候扮演的都是"追赶者"的角色。DeepSeek V4 的出现，至少在推理这个关键维度上，让这条鸿沟变窄了不少。

下面是 V4 Pro 与主流模型的核心参数和定价对比：

模型	总参数量	激活参数量	上下文窗口	输入价格（$/百万 token）	输出价格（$/百万 token）
DeepSeek V4 Pro	1.6 万亿	490 亿	100 万 token	$0.145	$3.48
DeepSeek V4 Flash	2840 亿	130 亿	100 万 token	$0.14	$0.28
DeepSeek V3.2	6710 亿	370 亿	64 万 token	$0.07	$0.28
Kimi K 2.6	1.1 万亿	—	—	—	—
MiniMax M1	4560 亿	—	—	—	—

从这张表能清晰看到，V4 Pro 不仅在规模上甩开同行，定价策略也相当激进。用十分之一甚至百分之一的价格，就能拿到接近顶级闭源模型的推理能力——这个等式在一年前还是天方夜谭。

不过，DeepSeek 自己也坦诚地提到了短板。在知识类测试中，V4 系列还是略逊于 GPT-5.4 和 Gemini 3.1 Pro。实验室在报告中写道，这反映出一种"大约落后最前沿模型 3 到 6 个月"的发展轨迹。这个表述挺有意思的——它没有回避差距，但也在暗示：差距正在缩小，而且缩小的速度可能比很多人想象的要快。

这价格，简直不给同行留活路

如果说性能是硬实力，那价格就是 DeepSeek 的核武器。

V4 Flash 的定价是 输入每百万 token 仅 0.14 美元，输出 0.28 美元。这意味着什么？比 OpenAI 最便宜的 GPT-5.4 Nano 还要低，比 Google 的 Gemini 3.1 Flash 还便宜，甚至连 Claude Haiku 4.5 和 GPT-5.4 Mini 都被它压了一头。对于大多数日常应用场景来说，V4 Flash 的性能已经完全够用，而价格却低得让人难以置信。

旗舰版 V4 Pro 更夸张。虽然参数量是 1.6 万亿的庞然大物，但输入价格只要 每百万 token 0.145 美元，输出也不过 3.48 美元。对比一下：Gemini 3.1 Pro、GPT-5.5、Claude Opus 4.7 这些闭源旗舰模型，哪个不是贵得离谱？调用一次可能就要几美元甚至几十美元。DeepSeek 用开源模型的身份，把价格砍到了闭源对手的零头。

这种打法其实不难理解。DeepSeek 的思路一直很清晰：先把门槛降到最低，让开发者和企业能用得起，再靠生态规模吃饭。在 AI 这个赛道上，模型能力固然重要，但如果只有大公司才能负担得起，那技术的普及就无从谈起。

从商业逻辑上看，这也是开源模型挑战闭源巨头的经典路径。OpenAI 和 Google 靠高定价回收巨额研发成本，而 DeepSeek 选择了另一条路：用极致的性价比快速占领市场，然后用规模效应来摊薄成本。对于用户来说，多一个便宜好用的选择，总是好事。

但别急着开香槟，还有两个隐忧

性能数据好看，价格也更便宜，听起来似乎是完美升级？其实还有两个地方值得冷静看待。

第一，纯文本限制了想象空间。 V4 Flash 和 V4 Pro 目前都只支持文本输入输出。而像 GPT-4o、Gemini 这些闭源对手，早就实现了音频、视频、图像的多模态能力。你可以上传一张照片让它分析，或者让它直接生成一段语音回复。V4 系列在这个维度上明显落后，对于需要多模态交互的应用场景来说，这确实是个遗憾。

想想看现在的 AI 应用趋势：视觉理解、语音助手、视频生成，这些热门方向都离不开多模态能力。一个只能处理文本的模型，就像是一个只会写字但不会画画的天才——智商很高，但表达形式太单一了。当然，DeepSeek 大概率已经在研发多模态版本，这只是阶段性的选择。

第二，知识产权争议如影随形。 就在 V4 发布的同一天，美国方面刚刚指责中国通过大量代理账号，工业级规模地窃取美国 AI 实验室的知识产权。而 DeepSeek 本身也一直被 Anthropic 和 OpenAI 指控存在"蒸馏"行为——也就是通过反复调用竞争对手的 API，提取知识来训练自己的模型。

这些指控目前还没有被完全证实，争议本身也可能掺杂了地缘政治因素。但对于一家想要在国际市场上真正站稳脚跟的 AI 公司来说，声誉和信任同样重要。

当然，从另一个角度看，OpenAI 自己也曾经"站在巨人的肩膀上"。整个 AI 领域的发展史，就是一部不断借鉴、改进、超越的历史。关键是，最终你能不能拿出真正属于自己的东西。V4 系列在 MoE 架构上的优化、100 万 token 上下文窗口的实现、以及极低推理成本的达成——这些都不是简单的"复制粘贴"能做到的。

最后

DeepSeek V4 的发布，某种程度上标志着一个新阶段的到来。开源模型不再是"便宜但不够好"的代名词，它们正在用实打实的数据证明：你花十分之一的价格，也能买到接近顶级的 AI 能力。

V4 Pro 的 1.6 万亿参数、逼近 GPT-5.4 的推理成绩、低到离谱的定价——这些数字组合在一起，传递的信息再清楚不过：中国 AI 的力量，已经不容忽视。

当然，纯文本的限制、知识测试上的差距、以及持续笼罩的知识产权争议，提醒我们还不能过早宣布"开源胜利"。但至少，DeepSeek 正在让这场竞赛变得更加激烈，也更加有趣。

对于普通开发者和企业来说，这无疑是好消息。毕竟，谁不喜欢一个能力强、价格便宜、还能随便调用的 AI 模型呢？

【声明】内容源于网络

洞见畏来

专注于前沿科技趋势，剖析底层算法逻辑，深耕商业化场景落地

内容 0

粉丝 0

洞见畏来专注于前沿科技趋势，剖析底层算法逻辑，深耕商业化场景落地

总阅读0

粉丝0

内容0