大数跨境

DeepSeek终于开口要钱了:那个对资本说"不"的男人,低头了

DeepSeek终于开口要钱了:那个对资本说"不"的男人,低头了 觉醒AI科技
2026-04-20
7
点击蓝字
关注我们


DeepSeek终于开口要钱了。


据外媒报道,这家曾经对资本说"不"的公司,正在寻求至少3亿美元的首轮外部融资,估值不低于100亿美元。消息一出,投资圈的电话估计已经把梁文锋打爆了。



要知道,DeepSeek上一次被传融资还是14个月前。2025年2月,阿里投资10亿美元的传闻刚流出就被辟谣;3月,腾讯、阿里想谈合作,梁文锋一句"不急于融资"直接挡了回去。过去一年,DeepSeek确实"不像一家AI公司"——背靠幻方量化这棵摇钱树,2025年收益56.6%,管理规模超700亿,梁文锋完全不着急商业化,DeepSeek更像一个游离在资本市场之外的开源实验室。


但现在,情况变了。字节有豆包、即梦、视频生成模型;阿里腾讯押注世界模型;智谱、MiniMax已经登陆港股,市值一度突破3000亿港元。就连"小龙"月之暗面,估值都飙到了180亿美元。100亿美元放在今天的中国AI版图里,已经不再惊人。


更关键的是,DeepSeek也到了不得不变的时候。核心研究员郭达雅转投字节,虽然"亿元年薪"被辟谣,但人才流失的压力是真实的。当技术理想敌不过真金白银的期权激励,光靠梁文锋的个人魅力还能留住多少人?服务器、算力、数据、商业化——这些都不是纯研究机构能长期回避的命题。


如果这次融资属实,DeepSeek至少迈过了两道坎:一是终于愿意建立期权池,用股权留住人才,梁文锋也不用一个人扛下所有压力;二是从"研究机构"回归"商业公司"的正常轨道,治理结构、估值体系、长期预算,这些基本功必须补上。


过去一年,市场习惯了DeepSeek每次发布都震撼世界。但现在,它更需要学会的是——如何不震撼,但持续地活下去。



01


DeepSeek的底层模型能力仍然很强。


它在模型算法、工程效率、开源路线和降低推理成本上的贡献,仍然是中国AI过去一年最重要的技术事件之一。R1证明了一个小团队也可以用更少资源、更开放路线,做出世界级模型。


然而事实上,今天的AI竞争已经不是单点模型能力的竞争。


DeepSeek最强的是模型本身,同行则在模型之外做了更多事情。


最明显的是产品入口。


曾是国内AI App增长最快的DeepSeek,在2025年下半年被豆包反超月活,QuestMobile数据显示2025年8月豆包以1.57亿月活登顶中国原生AI App榜首,DeepSeek位居第二。


截至2026年3月,豆包全渠道月活已破3.31亿,为行业第2至第5名总和。模型爆红能带来初始流量,长期用户规模需靠产品、场景、运营和生态入口留存,这正是字节的优势——豆包依托抖音、剪映等生态及Seedance 2.0的视频生成能力实现持续分发,而DeepSeek虽在模型社区有口碑,却未在大众产品层面形成这类能力。


多模态也是类似问题。


DeepSeek推出过Janus-Pro、DeepSeek-OCR,但尚未构建起稳定完整的强势多模态产品体系。


当下AI竞争愈发注重文本、图像等多维度的统一体验,国内外头部企业均在布局这一方向。阿里、腾讯押注世界模型便是典型信号,阿里发布的Happy Oyster主打可互动演绎探索的AI数字世界,腾讯则开源混元3D世界模型2.0,支持多形式输入生成模拟3D世界。


这类布局暂未转化为成熟商业收入,却体现出大厂正将AI能力从聊天、代码场景,拓展至复杂的空间、视频、游戏等内容生产领域。


字节持续加码视频生成,Seedance 2.0让市场关注点转向多镜头、音画同步等高阶能力,其与剪映、抖音等产品的联动,能形成DeepSeek难以复制的产品闭环。


Agent和AI编程也是DeepSeek的短板。


DeepSeek不是没有工具调用和agent能力,但它还没有在开发者心智里形成类似Claude、GPT、Kimi、MiniMax、腾讯、阿里那样明确的生产力入口。



AI编程正在成为大模型商业化最清晰的场景,开发者只认效果好、稳定性强的工具。以Cursor为例,几乎没人会用DeepSeek来写代码,因为效果实在不尽人意。


这就是DeepSeek眼下的真实处境。


它不是不强,而是强得不够完整。模型效率上依然有优势,但在App入口、多模态、视频生成、世界模型、Agent、AI编程、企业服务和生态分发上,都被同行甩开了距离。对一家过去靠"技术奇迹"被记住的公司来说,这种落差格外刺眼。


梁文锋这次融资,不能简单理解成缺钱。更准确地说,是他意识到单靠基础模型已经撑不起下一阶段的竞争。DeepSeek需要的不只是钱,还有人才、服务器,以及一个更完整的商业生态。


02


DeepSeek现在最紧迫的问题,是人才。


2025年下半年起,DeepSeek多位核心成员相继离职:大模型训练核心王炳宣入职腾讯,OCR核心魏浩然离开,R1核心郭达雅加入字节;幻方时期加入、参与多模态工作的阮翀于2026年1月官宣入职元戎启行,罗福莉则加入小米负责AI相关业务。



这是DeepSeek爆红之后必然要面对的市场结果——核心研究员会成为所有大厂和AI创业公司疯狂争夺的对象。

过去,DeepSeek靠理想主义招人。技术挑战、开源声望、研究自由,再加上梁文锋本人的号召力,足以让顶尖人才心甘情愿加入。但今天AI行业的人才定价已经天翻地覆,行业头部研究员拿到近亿年包早已不是新闻,而DeepSeek开不出这样的价码。

所以对梁文锋来说,期权变得越来越重要。

DeepSeek过去不融资、不对外定价、保持独立运作,短期看确实减少了外部干扰。但长期下来,员工手里的期权成了一笔糊涂账——别的公司有融资轮次、有上市预期、有二级市场价格,员工至少知道自己手里的东西大概值多少钱。DeepSeek如果没有外部估值,没有清晰激励体系,核心人才很难相信自己真能分享到公司成长的红利。

恒业资本创始合伙人江一表示,大厂抢人开的从来不是单纯现金,而是现金加高估值期权。没有明确估值,DeepSeek很难让员工准确判断自己手里的期权到底对应什么未来。

这也是3亿美元融资真正重要的地方。

它未必是为了立刻大规模烧钱。按照江一的看法,100亿美元以下的估值对梁文锋来说甚至偏低。但估值过高,梁文锋自己也要背上更大的增长压力。所以这一轮融资很可能不只是拿钱,更是给公司定价,给团队定价,也给未来的激励体系定价。

DeepSeek早期的魅力,正来自它没有被资本市场推着走。江一提到,梁文锋本人反感投资人干预公司决策,对一个技术理想很强的创始人来说,融资意味着新的股东、新的约束、新的沟通成本,也意味着公司不可能再完全按照研究团队的节奏运转。

但这就是正常公司必须面对的代价。

公司的归公司,员工的归员工。如果DeepSeek希望继续留住最顶尖的人,就必须让团队成员看到可兑现的未来。不能只要求他们相信模型会越来越强,也要让他们相信——公司越来越值钱的时候,自己也能分到那部分发展红利。


03


DeepSeek要回归正常公司,人才只是第一关。第二关是服务稳定性。


2026年3月底,DeepSeek发生11小时宕机并登上热搜。模型商业化服务海量用户与开发者,需经检验,服务器不稳最直接的解决办法是加大资金投入,购置更多服务器、算力和冗余资源,搭建更完善的云服务与运维体系。


工程优化等手段虽重要,但高峰流量下诸多问题终究要靠资金解决。用户和开发者不会因模型的过往优势,长期容忍服务不可用、排队久、API波动等问题,也不会将核心业务依托于不稳定的接口。


第三关是数据和训练成本。


DeepSeek早期因模型结构、工程效率和蒸馏等技术做到极致,实现低成本训练,但V4阶段单轮训练成本已超5亿美元。Anthropic封锁蒸馏路径后,其下半年冲击第一梯队需采购更多高质量数据集,训练成本将大幅上升,昔日“低成本奇迹”难延续。


低成本训练印证了团队能力,而下一代基础模型仍需遵循Scaling Law产业规律,更强的模型需要更多优质数据、更大算力、更复杂的后训练系统等,越靠近第一梯队边际成本越高,还需承担国产算力适配和合规的持续投入成本——幻方量化因行业监管合规有相关投入,DeepSeek适配国产算力也需工程、测试团队的长期磨合。


DeepSeek过往以开源造影响力、API收费承接需求的商业化逻辑已不再适用,梁文锋正为其搭建完整商业体系,如订阅制、多档位API收费。生态并非开源即能自然形成,还需稳定API、开发者工具、企业服务等一系列基础设施,从0到1搭建商业生态需承担相应建设成本。


单纯依靠开源声量和基础API收入,难以支撑其成为具有全球影响力的基础模型公司,商业化并非背离技术路线,而是技术路线进入长期竞争的必要底座。所以,DeepSeek融资不是一个孤立事件。



这是服务器、数据、算力、人才、期权、商业化生态叠加之后的必然结果。对于以模型能力立身的DeepSeek来说,这些东西比估值数字本身更关键。


所以DeepSeek回到融资、估值、商业化这条"正常公司"的路,并不是退步。DeepSeek回归正常,对DeepSeek是好事,对梁文锋也是好事。


融资不代表梁文锋被资本裹挟,也可以意味着一家公司终于有能力打更长期的仗。对用户和行业来说,也该告别"DeepSeek时刻"了。


真正健康的局面,应该是DeepSeek继续做DeepSeek,其他模型也被看见、被比较、被承认。中国AI不应该永远等待一个名字再次震撼世界,而应该让很多公司在不同方向上一起往前走。


一家公司的成熟,常常不是从掌声最响的那一天开始,而是从掌声落下之后,它仍然愿意去修服务器、买数据、招人、谈客户、发账单、处理宕机、重写文档、把产品一点点变稳定开始。


如果DeepSeek真的走到这一步,它并不是失去特殊性。


它只是终于从一个被仰望的故事,回到了一家公司应该站立的地面。








📢 想获取更多 AI 大模型实战资料?

欢迎扫码加入【AI 大模型学习交流群

和行业伙伴一起,解锁 AI 落地全流程,

共享干货资源、交流技术难题!


图片/素材来源于网络,版权归原作者所有,侵删

一键关注 👇 点亮星标

科技前沿/行业快讯天天见




点击下方“阅读全文”查看更多内容

【声明】内容源于网络
0
0
觉醒AI科技
1234
内容 140
粉丝 0
觉醒AI科技 1234
总阅读3.6k
粉丝0
内容140