【灵思要闻】DeepSeek V4定于下周亮相，美股或再迎震荡！绕开英伟达，成本优势高达50倍- 大数跨境

首页

【灵思要闻】DeepSeek V4定于下周亮相，美股或再迎震荡！绕开英伟达，成本优势高达50倍

灵思极智

2026-03-04

导读：DeepSeek V4定于下周亮相，美股或再迎震荡！绕开英伟达，成本优势高达50倍

DeepSeek V4即将于下周正式发布：该模型为原生多模态，选择绕过英伟达，并针对国产芯片进行了深度优化。这可能会再次触动华尔街最敏感的神经：算力垄断格局松动，美股市场或将率先感受到压力。

各位，又到了可能见证行业变革的时刻！

据《金融时报》披露，DeepSeek V4预计在下周正式推出！

自上一代重大模型R1发布至今，已过去整整一年多。

在此期间，全球AI领域竞争激烈，OpenAI接连推出多代GPT模型，Anthropic的Claude跻身顶尖行列，谷歌Gemini也在快速迭代。整个硅谷正以前所未有的规模投入资金。

而DeepSeek在此期间有何动作？

它选择在杭州潜心钻研，没有举办发布会，没有进行路演宣传。

核心工作只有一项：精炼内功。

计划于下周亮相的V4，将是一个能够同时处理图片、视频和文本生成的原生多模态大模型。

更为关键的是，V4在优化适配方面，没有首选英伟达，而是优先与国内芯片厂商携手，针对国产AI芯片做了深度的性能调优。

这意味着DeepSeek V4不仅是模型版本的一次更迭，更代表了底层技术路线的战略调整。它标志着中国AI正从“借助他人芯片运行自身模型”的阶段，迈向“运用自主芯片驱动自身模型”的关键一步。

DeepSeek选择在国内重要会议前夕发布V4，无疑在传递一个清晰的信号：中国AI产业，不仅在奋力追赶，更在尝试塑造新的行业规则。

有网友评论称，“V4的推出将给OpenAI和谷歌带来显著压力。中国的发展步伐并未放缓，反而在加快速度。”

“这场人工智能领域的竞赛，其激烈程度再次升级。”

更有爆料指出，DeepSeek V4的API调用成本可能比竞争对手低出50多倍。

有观点甚至认为，美国股市可能因此再度承压。

V4的核心优势体现在哪些方面？

首要关键词：多模态能力。

以往的DeepSeek模型主要擅长文本处理——在代码编写和逻辑推理方面表现出色，但在图像和视频领域的能力相对薄弱。V4则有效弥补了这一不足。

根据目前流出的信息，V4是一个原生的多模态模型，它能同时解析并生成图像、视频以及文本内容。

此外，一个名为V4 Lite的版本已在某家推理服务商处开启内测，据称其上下文窗口高达100万token，性能表现显著超越了现有的网页版和应用版模型。

网络上流传的对比图显示，DeepSeek V4 Lite（内部代号“Sealion-lite”）在未启用思考模式的情况下，所生成的SVG图像质量已明显优于当前的DeepSeek V3.2思考模型。有网络大V声称，V4的代码编写能力甚至超过了目前的GPT和Claude。

第二个关键词：国产芯片适配。

这可能是V4最具战略意义的一项突破。

根据路透社和《金融时报》的报道，DeepSeek此次未遵循行业常规路径，即在新模型发布前首先与英伟达合作进行性能优化。他们选择了一种不同的方式，没有向这家美国芯片公司提供V4的早期接入权限。

DeepSeek通过V4向外界展示：即便不依赖特定芯片，我们同样能打造出世界级的模型。

当然，从客观角度看，在需要密集计算能力的模型预训练阶段，英伟达芯片仍占据主导。但在模型部署和推理这一决定商业化落地的关键环节，V4或许已成功实现了对国产芯片的全面适配。这一环节的突破，其潜在影响不容小觑。

第三个关键词：开源精神。

据知情人士透露，DeepSeek在发布V4的同时，会同步公开一份简要的技术说明，并在约一个月后发布更为详尽的技术报告。这延续了DeepSeek一贯倡导的“开放”理念，正如去年R1发布时附带的技术报告，曾为全球AI研究者提供了宝贵参考，被视为推理模型领域重要的开源贡献之一。

回望R1发布时刻

那一天，硅谷真切感受到了震动

要评估V4的潜在影响，不妨回顾去年DeepSeek R1发布时引发的行业震荡。

2025年1月20日，DeepSeek悄然推出了R1推理模型。没有盛大的发布会，没有媒体的预热造势——只是简单地将模型上线，并附上一份技术文档。

然而，这一举动迅速引发了全球范围内的广泛关注。R1在多项基准测试中的表现可与OpenAI当时最强的o1模型媲美甚至超越，而据DeepSeek称，其训练成本仅约560万美元，远低于GPT-4。

更为关键的是，R1选择了开源！

2025年1月27日，或许将被AI发展史铭记。当天，DeepSeek的移动应用下载量在美国苹果应用商店中超越ChatGPT，跃居免费应用榜首。同日，英伟达股价应声下跌近17%，单日市值蒸发约5890亿美元，刷新了美国公司单日市值损失的历史记录。博通股价跌幅超17%，微软下跌2.1%，纳斯达克指数整体承压。

知名投资人马克·安德森将DeepSeek誉为“我所见过的最令人惊叹和印象深刻的突破之一”。多位美国科技界人士将此事件比作“斯普特尼克时刻”，意指中国AI实力的显著崛起引发了全球关注。

当时，华尔街投资者普遍担忧的问题是：如果一家中国企业能用远低于美国同行的成本实现同等水平的模型，那么美国科技巨头每年高达数百亿美元的硬件基础设施投资是否依然合理？市场对英伟达高端GPU的旺盛需求是否会受到影响？

静默的一年，DeepSeek做了什么？

自R1发布后，DeepSeek进入了一年多的“静默研发期”，期间未推出新的旗舰级模型，主要进行渐进式的更新。但这并非停滞不前，实际上，他们一直在为V4的登场进行铺垫。

以下是其间的关键更新节点：

• 2025年3月：推出DeepSeek-V3-0324。这是对V3模型的一次重要升级，通过融合R1的强化学习技术改进了后训练流程，在数学和编程评测中的表现甚至优于GPT-4.5。

• 2025年5月：发布DeepSeek-R1-0528。作为R1的大幅升级版，其推理能力和代码生成质量显著提升，被视为当时开源推理模型的新标杆。

• 2025年8月：推出DeepSeek-V3.1。这是一次里程碑式更新，首次将V3和R1的能力整合至单一模型，支持“思考模式”与“非思考模式”的自由切换，在SWE-bench等基准测试中性能提升超40%。后续更新的V3.1-Terminus版本，进一步优化了多语言混合处理和Agent能力等问题。

• 2025年9月：发布DeepSeek-V3.2-Exp。该版本引入了新的稀疏注意力机制，为处理更长上下文和实现更高效率的推理奠定了架构基础。

• 2025年11月：发布DeepSeekMath V2。基于V3.2-Exp-Base构建，在多项数学竞赛中达到金牌水平，并验证了自验证技术的有效性。

• 2025年12月：正式发布DeepSeek-V3.2。其中的V3.2-Speciale版本在2025年国际数学奥林匹克和国际信息学奥林匹克中取得金牌级表现，并首次将思考能力整合到工具调用中。

• 2026年1月：先后发布关于Manifold-Constrained Hyper-Connections和Engram条件记忆技术的研究论文，业界普遍认为这些构成了V4的架构基础。前者改变了信息在模型层间的流动方式，后者使模型能更高效地选择性地记忆和调用上下文信息，为支持超长上下文处理提供了可能。

这一系列动作，都在为V4的最终亮相做着技术储备。

一场有准备的舆论博弈？

在V4即将发布的关键时刻，海外市场也出现了相关动向。

2月24日，Anthropic在社交媒体上公开发文，指控包括DeepSeek在内的三家机构对其Claude模型实施了“工业级蒸馏攻击”，声称这些机构通过与Claude进行大量对话，试图提取其能力来训练自身模型。

然而，随后发生的一幕颇具戏剧性。就在Anthropic提出指控的同一周，有网友发现一个现象：当用中文询问Claude“你是什么模型”时，它竟回答：“我是DeepSeek V3。”通过Anthropic官方API接口测试，也得到了相同结果。用法语提问时，Claude则回答“我是ChatGPT”。

这一插曲使得Anthropic的指控显得有些尴尬。其推文下方的大量评论中，相当比例是嘲讽和质疑。Reddit上的讨论则更为深入，有用户认为，这可能是一种有组织的舆论策略，旨在V4发布前抢占话语权，预先引导公众认知，无论V4表现如何，都可能被部分人先入为主地与负面标签关联，同时分散媒体对V4发布的关注度，试图避免类似去年R1发布时引发的市场震动。

美股市场会再次波动吗？

去年R1发布时，英伟达股价的单日大幅下跌令人记忆犹新。如今，V4不仅在模型能力上更进一步（具备多模态、百万级上下文、原生适配国产芯片等特点），更在战略层面明确了优先适配国产芯片的路径。如果V4发布后的公开评测再次印证其在效率方面的优势——即用相对更少的计算资源达到世界一流水平——那么，关于AI基础设施建设巨大投入必要性的讨论，很可能在华尔街投资者中再次引发思考。