点击关注
已关注公众号
当阿里与腾讯这对互联网 “老对手” 罕见地在同一张投资意向书上碰头,目标直指同一家成立不到三年的AI公司,整个科技圈都为之震动。
据最新消息,DeepSeek(深度求索)正启动成立以来的首轮外部融资,目标估值已飙升至超200亿美元,吸引了国内两大科技巨头的积极接洽。在全球AI大模型竞争进入白热化、资本愈发谨慎的今天,一家非巨头嫡系、纯技术驱动的初创公司,何以能让巨头们放下成见、争相押注?答案,藏在它颠覆行业的技术硬实力里。
靠效率破局:DeepSeek如何用技术颠覆算力军备竞赛?
全球 AI 大模型的竞争,一度被异化为 “堆参数、烧算力” 的军备竞赛。OpenAI、谷歌等巨头凭借数千张顶级GPU和百亿级美元投入,构筑起看似无法逾越的壁垒。但DeepSeek从诞生之初,就选择了一条截然不同的路 ——用架构创新,而非单纯的算力堆砌,来实现性能跃迁。这家由幻方量化孵化、核心团队几乎全为本土 AI 人才的公司,深刻理解中国在高端芯片领域的局限,因此将 “极致效率” 刻进了技术基因。
其最核心的突破,在于对MoE(混合专家)架构的革命性优化。不同于传统稠密模型每次推理都激活全部参数,DeepSeek的MoE模型如同一个精密分工的超级智囊团,将千亿参数拆分为数百个 “专家模块”,处理任务时只激活其中一小部分。以其旗舰模型为例,236B总参数下,单次仅激活约37B参数,在保持顶尖性能的同时,显存消耗降低 70%,推理速度提升数倍。这种 “巨人大脑、麻雀能耗” 的设计,让它在同等硬件下,性能可达国际同类模型的2-3倍,被业界称为 “AI界的拼多多”。
更关键的是,DeepSeek并未止步于此。它自研了动态稀疏注意力(DSA) 与GRPO 强化学习算法,前者让模型在处理128K超长上下文(约10万字文本)时,能精准锁定关键信息,效率提升5倍;后者则通过多阶段自我验证与强化学习,让模型的数学推理、复杂逻辑能力爆发式增长。其发布的DeepSeek-R1模型,在数学竞赛AIME、代码基准HumanEval等硬核测试中,成绩直接对标GPT-4o,一度登顶全球140国应用下载榜。这种 “用1/3的算力,做到比肩国际顶流” 的技术实力,正是它区别于其他国产模型、吸引巨头目光的核心壁垒。
脱离英伟达!全栈自主可控,为何是巨头最看重的王牌?
如果说高效架构是DeepSeek的 “内功”,那彻底实现国产算力全栈适配,则是它手中最让巨头心动的 “王炸”。就在融资消息爆出的同时,DeepSeek即将发布的V4模型传来重磅消息:它将成为全球首个完全脱离英伟达生态、全量跑通国产算力底座的顶级大模型。
据悉,DeepSeek V4已完成与华为昇腾950PR芯片的100%适配,底层技术栈从CUDA彻底迁移至华为CANN Next框架,实现了从训练到推理的全链路自主可控。这不仅是技术上的突破,更是战略层面的升维 —— 在全球科技竞争加剧、芯片供应链不确定性增加的背景下,摆脱对单一外部芯片生态的依赖,意味着掌握了生存与发展的绝对主动权。
对于阿里、腾讯而言,这一点价值千金。两大巨头均投入数百亿自研大模型(阿里通义、腾讯混元),但核心瓶颈始终卡在 “算力” 与 “效率”。阿里云需要为海量企业客户提供高性价比AI服务,腾讯则要为社交、游戏等亿级场景注入AI能力。DeepSeek不仅拥有顶尖的模型性能,更具备跨芯片平台的极致迁移与优化能力—— 除昇腾外,已适配海光DCU、沐曦等多款国产芯片。这种 “模型 - 芯片 - 框架” 的全栈适配能力,能直接为巨头的AI生态补上最关键的一块短板,帮助它们构建安全、自主、低成本的下一代AI基础设施。
200亿估值贵吗?技术拓疆与商业潜力才是定价核心
市场对 DeepSeek 200亿美元的估值不乏讨论,但放在技术与产业格局的维度看,这恰恰是对其技术拓展能力与未来商业潜力的精准定价。不同于许多停留在实验室的模型,DeepSeek的技术从一开始就面向真实世界的落地,并展现出极强的延展性。
在通用能力上,它是少数在中文理解、代码生成、专业推理三大核心领域全面对标国际顶流的国产模型。在中文语境测试中,其对隐喻、文化典故的理解精度远超海外模型;在代码领域,LeetCode算法题通过率达82%,结构清晰度评分超越GPT-4 Turbo。这些能力已通过API服务渗透进金融、法律、政务、软件开发等多个高价值场景,积累了大量企业级客户。
更具想象空间的是其技术的横向拓展。从语言模型出发,DeepSeek正快速布局多模态、具身智能、AI智能体等前沿方向。其高效的MoE架构与训练框架,可无缝迁移到图像、语音、视频等多模态数据处理;而强大的推理与自我进化能力,正是下一代能自主执行复杂任务的AI智能体的核心基础。对于阿里的电商生态、腾讯的社交与内容生态来说,这样一个 “全能型、高效率、自主可控” 的技术底座,能为其从消费互联网到产业互联网的全场景AI化,提供最强劲的引擎。
此次融资,不仅是DeepSeek的关键一跃,更是中国AI产业的一个重要分水岭。它证明了,在巨头林立、资本密集的AI赛道,纯粹的技术创新与硬核实力,依然是最稀缺、最有价值的资产。
阿里与腾讯的抢投,本质上是对 “中国原创AI技术” 的一次重量级背书。当一家初创公司能用技术打破算力垄断、实现自主可控,并具备定义下一代AI生态的潜力,200亿美元的估值,或许只是它价值的起点。随着V4模型的发布与巨头资源的注入,DeepSeek能否从一匹黑马,成长为挑战全球格局的中国AI新巨头?我们拭目以待。
往期推荐
融资10亿!上海国资重仓AMD前员工
吴夏青是谁?为什么离职英伟达创业?
点赞鼓励一下
图片来源:网络
本文不作为投资建议

