据传：200亿美元估值！阿里、腾讯抢投DeepSeek！- 大数跨境

首页

据传：200亿美元估值！阿里、腾讯抢投DeepSeek！

具身涌现

2026-04-22

导读：DeepSeek（深度求索）正启动成立以来的首轮外部融资，目标估值已飙升至超200亿美元，吸引了国内两大科技巨头的积极接洽。在全球AI大模型竞争进入白热化、资本愈发谨慎的今天，一家非巨头嫡系、纯技术驱

点击关注

已关注公众号

具身智能 I 人形机器人 I 具身智能融资 I 机器人

当阿里与腾讯这对互联网 “老对手” 罕见地在同一张投资意向书上碰头，目标直指同一家成立不到三年的AI公司，整个科技圈都为之震动。

据最新消息，DeepSeek（深度求索）正启动成立以来的首轮外部融资，目标估值已飙升至超200亿美元，吸引了国内两大科技巨头的积极接洽。在全球AI大模型竞争进入白热化、资本愈发谨慎的今天，一家非巨头嫡系、纯技术驱动的初创公司，何以能让巨头们放下成见、争相押注？答案，藏在它颠覆行业的技术硬实力里。

靠效率破局：DeepSeek如何用技术颠覆算力军备竞赛？

全球 AI 大模型的竞争，一度被异化为 “堆参数、烧算力” 的军备竞赛。OpenAI、谷歌等巨头凭借数千张顶级GPU和百亿级美元投入，构筑起看似无法逾越的壁垒。但DeepSeek从诞生之初，就选择了一条截然不同的路 ——用架构创新，而非单纯的算力堆砌，来实现性能跃迁。这家由幻方量化孵化、核心团队几乎全为本土 AI 人才的公司，深刻理解中国在高端芯片领域的局限，因此将 “极致效率” 刻进了技术基因。

其最核心的突破，在于对MoE（混合专家）架构的革命性优化。不同于传统稠密模型每次推理都激活全部参数，DeepSeek的MoE模型如同一个精密分工的超级智囊团，将千亿参数拆分为数百个 “专家模块”，处理任务时只激活其中一小部分。以其旗舰模型为例，236B总参数下，单次仅激活约37B参数，在保持顶尖性能的同时，显存消耗降低 70%，推理速度提升数倍。这种 “巨人大脑、麻雀能耗” 的设计，让它在同等硬件下，性能可达国际同类模型的2-3倍，被业界称为 “AI界的拼多多”。

更关键的是，DeepSeek并未止步于此。它自研了动态稀疏注意力（DSA） 与GRPO 强化学习算法，前者让模型在处理128K超长上下文（约10万字文本）时，能精准锁定关键信息，效率提升5倍；后者则通过多阶段自我验证与强化学习，让模型的数学推理、复杂逻辑能力爆发式增长。其发布的DeepSeek-R1模型，在数学竞赛AIME、代码基准HumanEval等硬核测试中，成绩直接对标GPT-4o，一度登顶全球140国应用下载榜。这种 “用1/3的算力，做到比肩国际顶流” 的技术实力，正是它区别于其他国产模型、吸引巨头目光的核心壁垒。

脱离英伟达！全栈自主可控，为何是巨头最看重的王牌？

如果说高效架构是DeepSeek的 “内功”，那彻底实现国产算力全栈适配，则是它手中最让巨头心动的 “王炸”。就在融资消息爆出的同时，DeepSeek即将发布的V4模型传来重磅消息：它将成为全球首个完全脱离英伟达生态、全量跑通国产算力底座的顶级大模型。

据悉，DeepSeek V4已完成与华为昇腾950PR芯片的100%适配，底层技术栈从CUDA彻底迁移至华为CANN Next框架，实现了从训练到推理的全链路自主可控。这不仅是技术上的突破，更是战略层面的升维 —— 在全球科技竞争加剧、芯片供应链不确定性增加的背景下，摆脱对单一外部芯片生态的依赖，意味着掌握了生存与发展的绝对主动权。

对于阿里、腾讯而言，这一点价值千金。两大巨头均投入数百亿自研大模型（阿里通义、腾讯混元），但核心瓶颈始终卡在 “算力” 与 “效率”。阿里云需要为海量企业客户提供高性价比AI服务，腾讯则要为社交、游戏等亿级场景注入AI能力。DeepSeek不仅拥有顶尖的模型性能，更具备跨芯片平台的极致迁移与优化能力—— 除昇腾外，已适配海光DCU、沐曦等多款国产芯片。这种 “模型 - 芯片 - 框架” 的全栈适配能力，能直接为巨头的AI生态补上最关键的一块短板，帮助它们构建安全、自主、低成本的下一代AI基础设施。

200亿估值贵吗？技术拓疆与商业潜力才是定价核心

市场对 DeepSeek 200亿美元的估值不乏讨论，但放在技术与产业格局的维度看，这恰恰是对其技术拓展能力与未来商业潜力的精准定价。不同于许多停留在实验室的模型，DeepSeek的技术从一开始就面向真实世界的落地，并展现出极强的延展性。

在通用能力上，它是少数在中文理解、代码生成、专业推理三大核心领域全面对标国际顶流的国产模型。在中文语境测试中，其对隐喻、文化典故的理解精度远超海外模型；在代码领域，LeetCode算法题通过率达82%，结构清晰度评分超越GPT-4 Turbo。这些能力已通过API服务渗透进金融、法律、政务、软件开发等多个高价值场景，积累了大量企业级客户。

更具想象空间的是其技术的横向拓展。从语言模型出发，DeepSeek正快速布局多模态、具身智能、AI智能体等前沿方向。其高效的MoE架构与训练框架，可无缝迁移到图像、语音、视频等多模态数据处理；而强大的推理与自我进化能力，正是下一代能自主执行复杂任务的AI智能体的核心基础。对于阿里的电商生态、腾讯的社交与内容生态来说，这样一个 “全能型、高效率、自主可控” 的技术底座，能为其从消费互联网到产业互联网的全场景AI化，提供最强劲的引擎。

此次融资，不仅是DeepSeek的关键一跃，更是中国AI产业的一个重要分水岭。它证明了，在巨头林立、资本密集的AI赛道，纯粹的技术创新与硬核实力，依然是最稀缺、最有价值的资产。

阿里与腾讯的抢投，本质上是对 “中国原创AI技术” 的一次重量级背书。当一家初创公司能用技术打破算力垄断、实现自主可控，并具备定义下一代AI生态的潜力，200亿美元的估值，或许只是它价值的起点。随着V4模型的发布与巨头资源的注入，DeepSeek能否从一匹黑马，成长为挑战全球格局的中国AI新巨头？我们拭目以待。

往期推荐