大数跨境

DeepSeek V4 来了:万亿参数开源模型,竟能叫板 GPT-5?

DeepSeek V4 来了:万亿参数开源模型,竟能叫板 GPT-5? 洞见畏来
2026-04-25
2
导读:🚀 DeepSeek V4 来了:万亿参数开源模型,竟能叫板 GPT-5?当所有人都以为大模型竞赛已经

当所有人都以为大模型竞赛已经进入尾声,一家中国公司用两张新的王牌,再次改写了游戏规则。


               
深夜突袭,两张王牌同时亮相

昨晚,AI 圈又热闹了。中国 AI 实验室 DeepSeek 毫无预兆地发布了 V4 系列模型——V4 FlashV4 Pro,分别对应轻量版和旗舰版。这是继去年 V3.2 和 R1 推理模型之后的又一次重大迭代,也是目前开源社区最期待的升级之一。

说到 R1,不少人还记忆犹新。去年年底,DeepSeek 用那款推理模型让整个行业为之一震,连 OpenAI 和 Anthropic 都感受到了压力。当时不少人评价它是"用极低的训练成本,做出了接近顶级闭源模型的效果"。如今 V4 的到来,更像是一次蓄谋已久的全面反攻——不仅要在推理上继续突破,还要在模型规模和综合性能上硬碰硬。

这两个新模型的参数规模堪称恐怖。V4 Pro 总参数量高达 1.6 万亿,是目前世界上最大的开源模型,直接超过了 Moonshot AI 的 Kimi K 2.6(1.1 万亿)和 MiniMax 的 M1(4560 亿)。连自家的 V3.2(6710 亿参数)也被远远甩在身后。轻量版的 V4 Flash 则拥有 2840 亿参数,虽然规模小了不少,但胜在速度够快,适合对延迟敏感的场景。

更关键的是,DeepSeek 在两款模型中都采用了 Mixture-of-Experts(MoE) 架构。简单理解,这个架构就像一家医院里,不需要每次看病都把全院所有科室的专家都叫到一起,而是根据病情只激活相关领域的专家。V4 Pro 虽然坐拥 1.6 万亿参数,但每次推理只激活 490 亿,这样既保持了强大的能力,又避免了资源浪费。MoE 架构还有一个好处——随着模型变大,训练成本的增长速度比传统密集模型慢得多。这也是为什么 DeepSeek 敢于把参数量堆到 1.6 万亿的重要原因。

另外,两个模型的上下文窗口都达到了 100 万 token。这个数字什么概念?意味着你可以直接把一本中等篇幅的书、一份大型代码库或者一套完整的技术文档塞进对话里,模型还能精准理解、准确回答。对于程序员来说,这简直是福音——直接把整个项目的源码丢进去让它分析,不用再一段一段地复制粘贴。


               
推理能力:终于有资格和顶尖模型坐在一张牌桌上了

DeepSeek 这次最有底气的一点,是它在推理基准测试上的突破。官方宣称 V4 系列已经 "几乎追平了"当前所有顶尖模型,无论开源还是闭源。

旗舰版 V4-Pro-Max 在多项推理测试中,击败了 OpenAI 的 GPT-5.2 和 Google 的 Gemini 3.0 Pro。在编程竞赛类基准测试里,两款 V4 模型的表现甚至与 GPT-5.4 不相上下。要知道,GPT-5.4 可是目前闭源阵营里最顶尖的模型之一,一个开源模型能追到这个水平,说实话已经相当不容易了。

这背后的意义其实比数字本身更重要。过去几年,开源模型和闭源模型之间一直存在一条看不见的鸿沟。GPT-4、Claude、Gemini 这些闭源模型凭借雄厚的算力投入和海量数据,始终保持着明显领先。开源社区虽然热闹,但很多时候扮演的都是"追赶者"的角色。DeepSeek V4 的出现,至少在推理这个关键维度上,让这条鸿沟变窄了不少。

下面是 V4 Pro 与主流模型的核心参数和定价对比:

模型 总参数量 激活参数量 上下文窗口 输入价格($/百万 token) 输出价格($/百万 token)
DeepSeek V4 Pro 1.6 万亿 490 亿 100 万 token $0.145 $3.48
DeepSeek V4 Flash 2840 亿 130 亿 100 万 token $0.14 $0.28
DeepSeek V3.2 6710 亿 370 亿 64 万 token $0.07 $0.28
Kimi K 2.6 1.1 万亿
MiniMax M1 4560 亿

从这张表能清晰看到,V4 Pro 不仅在规模上甩开同行,定价策略也相当激进。用十分之一甚至百分之一的价格,就能拿到接近顶级闭源模型的推理能力——这个等式在一年前还是天方夜谭。

不过,DeepSeek 自己也坦诚地提到了短板。在知识类测试中,V4 系列还是略逊于 GPT-5.4 和 Gemini 3.1 Pro。实验室在报告中写道,这反映出一种"大约落后最前沿模型 3 到 6 个月"的发展轨迹。这个表述挺有意思的——它没有回避差距,但也在暗示:差距正在缩小,而且缩小的速度可能比很多人想象的要快


               
这价格,简直不给同行留活路

如果说性能是硬实力,那价格就是 DeepSeek 的核武器。

V4 Flash 的定价是 输入每百万 token 仅 0.14 美元,输出 0.28 美元。这意味着什么?比 OpenAI 最便宜的 GPT-5.4 Nano 还要低,比 Google 的 Gemini 3.1 Flash 还便宜,甚至连 Claude Haiku 4.5 和 GPT-5.4 Mini 都被它压了一头。对于大多数日常应用场景来说,V4 Flash 的性能已经完全够用,而价格却低得让人难以置信。

旗舰版 V4 Pro 更夸张。虽然参数量是 1.6 万亿的庞然大物,但输入价格只要 每百万 token 0.145 美元,输出也不过 3.48 美元。对比一下:Gemini 3.1 Pro、GPT-5.5、Claude Opus 4.7 这些闭源旗舰模型,哪个不是贵得离谱?调用一次可能就要几美元甚至几十美元。DeepSeek 用开源模型的身份,把价格砍到了闭源对手的零头。

这种打法其实不难理解。DeepSeek 的思路一直很清晰:先把门槛降到最低,让开发者和企业能用得起,再靠生态规模吃饭。在 AI 这个赛道上,模型能力固然重要,但如果只有大公司才能负担得起,那技术的普及就无从谈起。

从商业逻辑上看,这也是开源模型挑战闭源巨头的经典路径。OpenAI 和 Google 靠高定价回收巨额研发成本,而 DeepSeek 选择了另一条路:用极致的性价比快速占领市场,然后用规模效应来摊薄成本。对于用户来说,多一个便宜好用的选择,总是好事。


               
但别急着开香槟,还有两个隐忧

性能数据好看,价格也更便宜,听起来似乎是完美升级?其实还有两个地方值得冷静看待。

第一,纯文本限制了想象空间。 V4 Flash 和 V4 Pro 目前都只支持文本输入输出。而像 GPT-4o、Gemini 这些闭源对手,早就实现了音频、视频、图像的多模态能力。你可以上传一张照片让它分析,或者让它直接生成一段语音回复。V4 系列在这个维度上明显落后,对于需要多模态交互的应用场景来说,这确实是个遗憾。

想想看现在的 AI 应用趋势:视觉理解、语音助手、视频生成,这些热门方向都离不开多模态能力。一个只能处理文本的模型,就像是一个只会写字但不会画画的天才——智商很高,但表达形式太单一了。当然,DeepSeek 大概率已经在研发多模态版本,这只是阶段性的选择。

第二,知识产权争议如影随形。 就在 V4 发布的同一天,美国方面刚刚指责中国通过大量代理账号,工业级规模地窃取美国 AI 实验室的知识产权。而 DeepSeek 本身也一直被 Anthropic 和 OpenAI 指控存在"蒸馏"行为——也就是通过反复调用竞争对手的 API,提取知识来训练自己的模型。

这些指控目前还没有被完全证实,争议本身也可能掺杂了地缘政治因素。但对于一家想要在国际市场上真正站稳脚跟的 AI 公司来说,声誉和信任同样重要。

当然,从另一个角度看,OpenAI 自己也曾经"站在巨人的肩膀上"。整个 AI 领域的发展史,就是一部不断借鉴、改进、超越的历史。关键是,最终你能不能拿出真正属于自己的东西。V4 系列在 MoE 架构上的优化、100 万 token 上下文窗口的实现、以及极低推理成本的达成——这些都不是简单的"复制粘贴"能做到的。


               
最后

DeepSeek V4 的发布,某种程度上标志着一个新阶段的到来。开源模型不再是"便宜但不够好"的代名词,它们正在用实打实的数据证明:你花十分之一的价格,也能买到接近顶级的 AI 能力。

V4 Pro 的 1.6 万亿参数、逼近 GPT-5.4 的推理成绩、低到离谱的定价——这些数字组合在一起,传递的信息再清楚不过:中国 AI 的力量,已经不容忽视

当然,纯文本的限制、知识测试上的差距、以及持续笼罩的知识产权争议,提醒我们还不能过早宣布"开源胜利"。但至少,DeepSeek 正在让这场竞赛变得更加激烈,也更加有趣。

对于普通开发者和企业来说,这无疑是好消息。毕竟,谁不喜欢一个能力强、价格便宜、还能随便调用的 AI 模型呢?


【声明】内容源于网络
0
0
洞见畏来
专注于前沿科技趋势,剖析底层算法逻辑,深耕商业化场景落地
内容 0
粉丝 0
洞见畏来 专注于前沿科技趋势,剖析底层算法逻辑,深耕商业化场景落地
总阅读0
粉丝0
内容0