DeepSeek终于开口要钱了：那个对资本说"不"的男人，低头了- 大数跨境

首页

DeepSeek终于开口要钱了：那个对资本说"不"的男人，低头了

觉醒AI科技

2026-04-20

点击蓝字

关注我们

DeepSeek终于开口要钱了。

据外媒报道，这家曾经对资本说"不"的公司，正在寻求至少3亿美元的首轮外部融资，估值不低于100亿美元。消息一出，投资圈的电话估计已经把梁文锋打爆了。

要知道，DeepSeek上一次被传融资还是14个月前。2025年2月，阿里投资10亿美元的传闻刚流出就被辟谣；3月，腾讯、阿里想谈合作，梁文锋一句"不急于融资"直接挡了回去。过去一年，DeepSeek确实"不像一家AI公司"——背靠幻方量化这棵摇钱树，2025年收益56.6%，管理规模超700亿，梁文锋完全不着急商业化，DeepSeek更像一个游离在资本市场之外的开源实验室。

但现在，情况变了。字节有豆包、即梦、视频生成模型；阿里腾讯押注世界模型；智谱、MiniMax已经登陆港股，市值一度突破3000亿港元。就连"小龙"月之暗面，估值都飙到了180亿美元。100亿美元放在今天的中国AI版图里，已经不再惊人。

更关键的是，DeepSeek也到了不得不变的时候。核心研究员郭达雅转投字节，虽然"亿元年薪"被辟谣，但人才流失的压力是真实的。当技术理想敌不过真金白银的期权激励，光靠梁文锋的个人魅力还能留住多少人？服务器、算力、数据、商业化——这些都不是纯研究机构能长期回避的命题。

如果这次融资属实，DeepSeek至少迈过了两道坎：一是终于愿意建立期权池，用股权留住人才，梁文锋也不用一个人扛下所有压力；二是从"研究机构"回归"商业公司"的正常轨道，治理结构、估值体系、长期预算，这些基本功必须补上。

过去一年，市场习惯了DeepSeek每次发布都震撼世界。但现在，它更需要学会的是——如何不震撼，但持续地活下去。

DeepSeek的底层模型能力仍然很强。

它在模型算法、工程效率、开源路线和降低推理成本上的贡献，仍然是中国AI过去一年最重要的技术事件之一。R1证明了一个小团队也可以用更少资源、更开放路线，做出世界级模型。

然而事实上，今天的AI竞争已经不是单点模型能力的竞争。

DeepSeek最强的是模型本身，同行则在模型之外做了更多事情。

最明显的是产品入口。

曾是国内AI App增长最快的DeepSeek，在2025年下半年被豆包反超月活，QuestMobile数据显示2025年8月豆包以1.57亿月活登顶中国原生AI App榜首，DeepSeek位居第二。

截至2026年3月，豆包全渠道月活已破3.31亿，为行业第2至第5名总和。模型爆红能带来初始流量，长期用户规模需靠产品、场景、运营和生态入口留存，这正是字节的优势——豆包依托抖音、剪映等生态及Seedance 2.0的视频生成能力实现持续分发，而DeepSeek虽在模型社区有口碑，却未在大众产品层面形成这类能力。

多模态也是类似问题。

DeepSeek推出过Janus-Pro、DeepSeek-OCR，但尚未构建起稳定完整的强势多模态产品体系。

当下AI竞争愈发注重文本、图像等多维度的统一体验，国内外头部企业均在布局这一方向。阿里、腾讯押注世界模型便是典型信号，阿里发布的Happy Oyster主打可互动演绎探索的AI数字世界，腾讯则开源混元3D世界模型2.0，支持多形式输入生成模拟3D世界。

这类布局暂未转化为成熟商业收入，却体现出大厂正将AI能力从聊天、代码场景，拓展至复杂的空间、视频、游戏等内容生产领域。

字节持续加码视频生成，Seedance 2.0让市场关注点转向多镜头、音画同步等高阶能力，其与剪映、抖音等产品的联动，能形成DeepSeek难以复制的产品闭环。

Agent和AI编程也是DeepSeek的短板。

DeepSeek不是没有工具调用和agent能力，但它还没有在开发者心智里形成类似Claude、GPT、Kimi、MiniMax、腾讯、阿里那样明确的生产力入口。

AI编程正在成为大模型商业化最清晰的场景，开发者只认效果好、稳定性强的工具。以Cursor为例，几乎没人会用DeepSeek来写代码，因为效果实在不尽人意。

这就是DeepSeek眼下的真实处境。

它不是不强，而是强得不够完整。模型效率上依然有优势，但在App入口、多模态、视频生成、世界模型、Agent、AI编程、企业服务和生态分发上，都被同行甩开了距离。对一家过去靠"技术奇迹"被记住的公司来说，这种落差格外刺眼。

梁文锋这次融资，不能简单理解成缺钱。更准确地说，是他意识到单靠基础模型已经撑不起下一阶段的竞争。DeepSeek需要的不只是钱，还有人才、服务器，以及一个更完整的商业生态。

DeepSeek现在最紧迫的问题，是人才。

2025年下半年起，DeepSeek多位核心成员相继离职：大模型训练核心王炳宣入职腾讯，OCR核心魏浩然离开，R1核心郭达雅加入字节；幻方时期加入、参与多模态工作的阮翀于2026年1月官宣入职元戎启行，罗福莉则加入小米负责AI相关业务。

这是DeepSeek爆红之后必然要面对的市场结果——核心研究员会成为所有大厂和AI创业公司疯狂争夺的对象。

过去，DeepSeek靠理想主义招人。技术挑战、开源声望、研究自由，再加上梁文锋本人的号召力，足以让顶尖人才心甘情愿加入。但今天AI行业的人才定价已经天翻地覆，行业头部研究员拿到近亿年包早已不是新闻，而DeepSeek开不出这样的价码。

所以对梁文锋来说，期权变得越来越重要。

DeepSeek过去不融资、不对外定价、保持独立运作，短期看确实减少了外部干扰。但长期下来，员工手里的期权成了一笔糊涂账——别的公司有融资轮次、有上市预期、有二级市场价格，员工至少知道自己手里的东西大概值多少钱。DeepSeek如果没有外部估值，没有清晰激励体系，核心人才很难相信自己真能分享到公司成长的红利。

恒业资本创始合伙人江一表示，大厂抢人开的从来不是单纯现金，而是现金加高估值期权。没有明确估值，DeepSeek很难让员工准确判断自己手里的期权到底对应什么未来。

这也是3亿美元融资真正重要的地方。

它未必是为了立刻大规模烧钱。按照江一的看法，100亿美元以下的估值对梁文锋来说甚至偏低。但估值过高，梁文锋自己也要背上更大的增长压力。所以这一轮融资很可能不只是拿钱，更是给公司定价，给团队定价，也给未来的激励体系定价。

DeepSeek早期的魅力，正来自它没有被资本市场推着走。江一提到，梁文锋本人反感投资人干预公司决策，对一个技术理想很强的创始人来说，融资意味着新的股东、新的约束、新的沟通成本，也意味着公司不可能再完全按照研究团队的节奏运转。

但这就是正常公司必须面对的代价。

公司的归公司，员工的归员工。如果DeepSeek希望继续留住最顶尖的人，就必须让团队成员看到可兑现的未来。不能只要求他们相信模型会越来越强，也要让他们相信——公司越来越值钱的时候，自己也能分到那部分发展红利。

DeepSeek要回归正常公司，人才只是第一关。第二关是服务稳定性。

2026年3月底，DeepSeek发生11小时宕机并登上热搜。模型商业化服务海量用户与开发者，需经检验，服务器不稳最直接的解决办法是加大资金投入，购置更多服务器、算力和冗余资源，搭建更完善的云服务与运维体系。

工程优化等手段虽重要，但高峰流量下诸多问题终究要靠资金解决。用户和开发者不会因模型的过往优势，长期容忍服务不可用、排队久、API波动等问题，也不会将核心业务依托于不稳定的接口。

第三关是数据和训练成本。

DeepSeek早期因模型结构、工程效率和蒸馏等技术做到极致，实现低成本训练，但V4阶段单轮训练成本已超5亿美元。Anthropic封锁蒸馏路径后，其下半年冲击第一梯队需采购更多高质量数据集，训练成本将大幅上升，昔日“低成本奇迹”难延续。

低成本训练印证了团队能力，而下一代基础模型仍需遵循Scaling Law产业规律，更强的模型需要更多优质数据、更大算力、更复杂的后训练系统等，越靠近第一梯队边际成本越高，还需承担国产算力适配和合规的持续投入成本——幻方量化因行业监管合规有相关投入，DeepSeek适配国产算力也需工程、测试团队的长期磨合。

DeepSeek过往以开源造影响力、API收费承接需求的商业化逻辑已不再适用，梁文锋正为其搭建完整商业体系，如订阅制、多档位API收费。生态并非开源即能自然形成，还需稳定API、开发者工具、企业服务等一系列基础设施，从0到1搭建商业生态需承担相应建设成本。

单纯依靠开源声量和基础API收入，难以支撑其成为具有全球影响力的基础模型公司，商业化并非背离技术路线，而是技术路线进入长期竞争的必要底座。所以，DeepSeek融资不是一个孤立事件。