中欧科技战队 | DeepSeek「冲击波」之后：AI产业巨变前夜，你该了解的一切



中欧科技战队 | DeepSeek「冲击波」之后：AI产业巨变前夜，你该了解的一切

中欧基金

2025-02-19

导读：关注下一代基座大模型落地

新年伊始，DeepSeek在全球科技市场掀起了一场「AI海啸」。

上线一周用户数破亿并登顶全球应用商店下载榜单，一个月日活突破3000万……这家来自中国的人工智能初创公司不仅持续刷新着行业纪录，并且通过开源的方式「造福」了整个中国AI市场，无论是大模型厂商、企业开发者还是每一个普通用户。而由它产生「鲶鱼效应」也在更深层次颠覆了大模型行业过往的发展逻辑。

透过现象看本质，DeepSeek的出现将如何影响全球AI产业链？它是否真的将成为中美AI竞争叙事的转折点？值得我们投资者去关注把握的投资机会有哪些呢？

带着这些问题，我们邀请到了中欧基金权益研究部副总监、中欧信息科技混合拟任基金经理——杜厚良一起聊聊，在DeepSeek带来技术震撼之后，关于这场即将发生的AI产业巨变，我们需要了解的那些事。

DeepSeek「横空出世」：

意料之外，情理之中

用最简单的方式来介绍一下

DeepSeek究竟是什么？

DeepSeek是一家人才密度和算力密度高、使命追求专一的人工智能公司。它是一个「火炬的传递手」，在前人的基础上，通过一些智慧和优化，以一个更低的成本让广大的老百姓也能用到最先进的AI模型。

从人才密度来讲，DeepSeek不到140人的团队是非常高质量的，由专业的IT人员组成。从算力密度来讲，它的股东在国内是少数有万卡算力集群的一家公司。

DeepSeek是全球第一个用开源方式复现了强化学习的模型，开源带来的好处是，全球所有的模型能力可以迅速提升到类ChatGPT-4或者类GPT-o1的能力层面。用一句话讲就是「旧时王谢堂前燕，飞入寻常百姓家」，这可能是DeepSeek为整个世界带来的最大贡献。

有一种说法是，DeepSeek用不到

600万美金干成了硅谷巨头花费数十亿

美金的模型，它的降本水平到底如何？

这两个维度的比较不太准确，因为500多万美金是单次训练成本，但几十亿美金是全成本，它包括了人才、算力采购、数据集标注优化等各方面的成本。

从可比成本来看，GPT4当时单次模型训练成本大概在1亿美金，通过硬件的优化，我们预估现在成本大概在2000万-4200万美金，所以DeepSeek真实的降本大概在4到6倍左右。

按照大模型正常的发展规律，算力成本是每年下降十倍的。对比Claude 3.5和ChatGPT-4，Claude 3.5晚了25个月，它的算力成本下降了10倍，DeepSeek-V3比ChatGPT-4晚了22个月，它的成本下降30倍，这也处于成本下降的正常斜率。

但是在任何一个领域做到全球第一，这一定是一件令人振奋的事情，尤其做这件事的又是一个中国较小的团队。

DeepSeek能够实现高水平的训练效率

和极低的训练成本，

主要是源于哪些创新？

创新主要来源于DeepSeek对算力卡和对模型架构的理解。

比如，它通过FP8（8位浮点数）低精度的调用去替代FP16（半精度浮点数），在文字模型这个领域用低成本实现了相同的好效果。有公开报道提到，DeepSeek专门训练H800这个集群，通过架构提升了通信能力。还有MoE模型的调用（注：Mixed Expert，混合专家模型，主要用于处理大规模数据和复杂任务），ChatGPT-4可能一次调用3000亿个参数，但DeepSeek优化到一次只调用370亿个参数，也是大幅降本。

说到DeepSeek常常会提到「模型蒸馏」、

「数据压缩」，是什么意思？

对数据的处理思路有什么不一样？

「模型蒸馏」实际是去实现一个基座模型60%-80%的能力，用一个小的参数去部署在端侧。DeepSeek做的一个很大的创新是通过减少SFT（Supervised Fine-tuning，监督微调）在模型蒸馏阶段实现大幅的降本。

另外一个概念是「数据压缩」，是我们提炼出一些客观规律、社会真理来概括完整的数据集，大模型的本质其实就是对数据的极致压缩。

AI竞争叙事：

缩小差距，竞争加剧

怎么看大模型的开源和闭源之争

以及不同路线带来的结果？

闭源是指程序源代码以及核心技术是对外保密的，开源则是公开的、可以对全世界共享。它们没有高低优劣之分，每个企业去选择开源和闭源一定是结合企业价值、社会价值，包括对国家的价值综合考虑的结果。

因为开源，Deepseek的出现让各家大模型在GPT-4这个水准上面的能力大幅接近。但在大模型的发展和探索上，永远还有一条更新的路，就是追求下一代基座大模型的能力。在这个模型能力的探索上，Deepseek的出现让更前沿的厂商产生了危机感，反而加剧了竞争。

我们大概和海外顶尖技术水平

有多大差距？

借用专业人士的评论，大概在7到12个月，但这个差距不太好量化，因为真正去追逐前沿大模型的厂商其实都没有开源。如果我们去期待下一代大模型落地，还是要关注全球范围内人才密度和算力密度更强的公司。

产业之变：

算力拐点，应用提速

Deepseek崛起

会改变算力的供需格局吗？

当Deepseek刚开始出来的时候，很多人的第一反应是用非常低的成本可以训练前沿大模型，是不是算力需求崩塌了。其实，当我们去冷静分析的时候，就明白这个结论是错误的。

Deepseek横空出世之后，各家海外大厂的资本开支都是上修的。与此同时，国内大厂对于算力的需求激增，不只是对于海外算力，也包括国产算力。

一方面，在追逐先进基座大模型这条路上，还是需要用更多的参数、更多的数据量、更多的卡去把模型堆起来。另一方面，当更多人去使用现有模型的时候，推理需求增加带来的算力需求增长将远超预训练的需求量级。

而对于光模块行业，除了算力需求总盘子之外，还有一个需求变量需要关注。从理论上来讲，做预训练和推理的连接方式是可以改变的。后者对集群规模的要求没有预训练那么高，后面可以关注这方面的变化。

AI应用的落地会进一步提速吗？

什么时候能实现从量变到质变的突破？

提速这个结论一定是正确的，但是真正的AI应用端侧爆发有两个必要条件，第一是基座模型的能力，第二是降本。

DeepSeek在这一代基座模型的基础上，实现了文字模型的大幅降本。目前在业务领域最看好的还是企业的一些本地部署，即企业利用自身的数据去完成企业管理和营销的行为。还有一些文字处理的领域，比如教育、法律、客服等可能出现率先爆发的机会。

其实现在已经有一个质变出现，就是chatbot（聊天模型）已经大幅代替了搜索。不管是国内还是海外，搜索引擎调用的市占率都是大幅降低的，现在很多搜索工作都可以通过大模型的chatbot去完成的，这在全球是一块巨大的市场，大概在5,000亿美金左右。

关于下一代指数级的潜力爆发，如果2025年能够出现下一代基座大模型，那么在2026、2027年会涌现更多的创新。

怎么看接下来的AI国产化，未来会

发生哪些新的变化？

硬件方面，DeepSeek的出现让更多的人产生更多的应用，需要降低推理成本。客观来讲，国内的算力卡不管是单芯片能力还是计算能力是比海外算力卡弱的，想要在预训练的阶段替代难度较大，但是在推理阶段有很大的替代空间，所以，由推理需求暴增带来的国内算力市场空间变大。

与此同时，考虑到中美关系，未来国内厂商购买海外算力的难度将陡增，所以可能从今年下半年开始，更多采购会偏向国内。在这两个逻辑的加持下，不管是算力芯片还是存储、制造的国产化都有较大的机会。

软件方面，DeepSeek拉近了国内大模型厂商和海外的差距，我们看到苹果与阿里合作（新闻来源：证券时报，2025.2.13），其他大模型厂商最近也在积极发论文。

投资逻辑：

确定性与持续性

中国的科技资产会不会迎来

新一轮的定价逻辑？

在一个产业发展的时候，定价的本质逻辑有两点：这个产业的未来市场空间有多大？它爆发的可能性有没有持续提高？

DeepSeek的出现提高了这个产业爆发的可能性，DeepSeek大概在一个月的左右的时间积累了3000万以上的日活，这个爆发的斜率是投资者比较喜欢的。海外一直把AI这个行业定义成未来十年甚至几十年这样一个行业。国内也已经慢慢地同步到这个认知，投资热情有较强的持续性。

哪些AI领域的投资机会值得关注？

我们在投资和研究的过程中把整个产业链分成四块：海外的算力、国内的算力、应用侧以及端侧。

在训练与推理的「双轮驱动」下，不管是国内算力还是海外算力芯片需求都在增加。海外可以重点关注ASIC芯片及配套产业链，国内的产能缺口则为推理芯片、存储方案等国产替代斜率高的环节带来布局机会。

在应用侧，垂直场景可能率先迎来爆发。比如，开源模型+垂直数据使得越来越多企业能够以较低的成本快速部署大模型，从而实现企业经营和管理的大幅降本增效；消费端的教育、娱乐以及个人助手等场景也有望迎来爆发。

相比之下，端侧爆发还需等待「临界点」。如果能在2025年实现技术突破，随着多模态的成熟，AI眼镜和车载助手等在复杂场景的渗透率有望提升。

长期来看，AI的投资需要考虑软件周期和硬件周期的迭代，投资时间可能持续较长，且有比较强的专业度。

2月17日推文中奖用户

点赞推荐

留言评论

2月18日推文中奖用户

点赞推荐

红包口令已通过公众号私信发送，请于有效期内进行领取，避免过期失效。

滑动查看完整风险提示

基金有风险，投资需谨慎。以上内容仅供参考，不预示未来表现，也不作为任何投资建议。其中的观点和预测仅代表当时观点，今后可能发生改变。未经同意请勿引用或转载。

基金管理人承诺以诚实信用、勤勉尽责的原则管理和运用基金资产，但不保证基金一定盈利，也不保证最低收益。基金的过往业绩并不预示其未来表现，基金管理人管理的其他基金的业绩并不构成基金业绩表现的保证。您在做出投资决策之前，请仔细阅读基金合同、基金招募说明书和基金产品资料概要等产品法律文件和风险揭示书，充分认识基金的风险收益特征和产品特性，认真考虑基金存在的各项风险因素，并根据自身的投资目的、投资期限、投资经验、资产状况等因素充分考虑自身的风险承受能力，在了解产品情况及销售适当性意见的基础上，理性判断并谨慎做出投资决策。

点亮“赞+推荐”

截图并私信发给公众号后台

抽10位朋友送8.8元红包

【声明】内容源于网络

中欧基金

用长期业绩说话

内容 617

粉丝 0

中欧基金用长期业绩说话

总阅读173

粉丝0

内容617