大数跨境

产业|从芯到端:DeepSeek大模型革新AI产业链

产业|从芯到端:DeepSeek大模型革新AI产业链 中国建投
2025-02-10
2



  • JIC投资观察原创文章

  • 中国建投子公司建投华科

  • 作者:陈伊荻,冯源

  • 本文3317字,阅读时间约8分钟


年初,一场名为DeepSeek的“旋风”忽然席卷了全球科技圈。


2024年12月26日,杭州深度求索公司发布DeepSeek-V3,这是全球首个全开源MoE(混合专家)模型。根据DeepSeek官方公布的性能测试,该大模型在数学测试、编程等多个领域与OpenAI的GPT-o1模型表现旗鼓相当;同时,通过多种算法优化与架构创新,DeepSeek大幅降低了模型的训练成本与训练时间:DS使用的英伟达H800 性能不及OpenAI使用的英伟达H100 GPU,但其训练成本与训练时间相比OpenAI减少超90%;DeepSeek的推理成本也显著低于竞争对手,其API调用成本仅为GPT-o1模型的2-3%。


2025年1月15日,DeepSeek官方App正式发布。


1月20日,DeepSeek-R1推理模型发布,其各方面能力相比DeepSeek-V3再次提升,并同步开源模型权重,允许用户通过蒸馏技术借助 R1 训练其他模型。


1月26日,DeepSeek登顶中美等140个国家/地区的免费App下载排行榜。


1月27日,纳斯达克科技股开启“踩踏模式”,投资者开始质疑美国科技巨头高成本AI研发模式的可持续性。英伟达、台积电单日分别暴跌17.0%、13.3%,纳斯达克指数一度下挫4.3%。


1月31日,英伟达称,DeepSeek是一个具有最先进推理能力的开放模型,同时宣布DeepSeek R1正式上线英伟达NIM平台。


2月1日,OpenAI CEO Sam Altman表示,DeepSeek削弱了OpenAI的领先地位。


DeepSeek大模型的技术革新,不仅触发了全球最顶尖AI大模型及相关科技公司的剧烈震荡,更有可能为AI产业链的价值分配逻辑带来革新。


本文从上游算力与基础设施商、中游模型商与数据服务商、下游应用提供商三大环节切入,分析DeepSeek大模型对AI全产业链的深远影响。



01  


上游——算力与基础设施:利好GPU国产替代与推理需求



      

GPU芯片具有强大的并行计算能力,主要用于模型训练中,用以加速训练时所需的海量数据处理;而ASIC芯片作为一种专用芯片,在处理特定任务时,能够实现更高的处理速度和更低的能耗,因此更适用于推理计算,让AI大模型在使用过程中能够更高效响应。


根据DeepSeek官方公布的技术文档,DeepSeek-V3模型的训练成本为557.6万美元,训练使用英伟达H800 GPU。相比之下,同样是开源模型的Meta旗下Llama 3.1 405B模型的预训练成本约5800万美元,而OpenAI的GPT-4o模型的训练成本约6300万美元,且两者使用的均是性能更加优异的英伟达H100 GPU芯片。


对于GPU芯片而言,DeepSeek的优异表现,首先冲击的就是英伟达在GPU芯片领域的统治地位。尽管DeepSeek仍然使用英伟达芯片进行训练,但其证明了国产大模型有能力摆脱对于英伟达高端GPU的依赖。


如国内著名AI 基础设施平台商硅基流动就在2月2日宣布:通过双方联合创新,并借助自研推理加速引擎,团队基于华为云昇腾云服务部署的DeepSeek模型已达全球高端GPU部署模型的同等效果。大模型厂商可与华为昇腾等国产GPU厂商及浪潮信息、中科曙光等服务器厂商合作,通过算法-硬件协同优化提升竞争力,就像OpenAI与英伟达、AMD共同合作开发芯片一样。这也同样利好国内AI芯片上游产业链,如互联、先进封装、光刻机等。


同时,DeepSeek证明了通过优化算法架构与训练方法创新也能够在大模型训练领域取得领先地位,而非单纯堆叠巨量算力,可能使算力芯片与基础设施的需求暂时下降。


摩根士丹利在最新报告中指出:“由于DeepSeek开源模型引发的‘低成本AI算力范式’冲击,科技巨头可能削减AI GPU订单。英伟达GB200芯片的2025年出货量预期已从3万-3.5万件下调至2万-2.5万件。”


相应地,如果对高端数据中心 GPU 的需求下降,数据中心扩张的必要性也会减少,这可能也会影响网络设备、电力基础设施、服务器冷却解决方案的市场需求,特别是国内与英伟达产业链上数据中心相关的企业可能迎来短期阵痛,但长期而言,这些企业具备坚实的技术基础,即使脱离英伟达架构,也同样能够在国产替代的产业链中寻得一席之地。


不过笔者认为,对上游GPU芯片与基建的需求降低只是短期的。长期而言,Scailing Law仍未失效,算力的增加仍然可能带来模型性能提升,所以部分企业仍然会尝试通过扩张算力来训练模型;而且,AI 模型的低成本化有望扩大应用场景,特别是多模态应用,带来AI应用的大规模普及,届时对于上游GPU芯片与基建的需求又将迎来蓬勃生长。


对于国内而言,DeepSeek的成功带来的AI上游全面国产替代的市场潜力,将对冲短期内的需求下降;长期而言,国产大模型与国产GPU芯片、基建商必定是共赢的局面。


对于ASIC芯片而言,DeepSeek的出现无论从短期还是长期而言都是好消息。传统AI行业以“训练驱动”为主,依赖大规模的GPU算力;而DeepSeek通过知识蒸馏技术,将大模型的能力迁移至轻量化模型,显著减少了对云端算力的依赖。


这种技术路径的转变,促进了推理与边缘计算的发展,利好ASIC芯片。摩根士丹利预测,到2025年,全球AI投资中推理算力的占比将显著提升,四大科技巨头的相关投入或达3000亿美元。而国产ASIC厂商将受益于国产的开源模型适配需求,在自主可控政策下抢占本土市场。


同时,推理需求增长将驱动分布式计算架构普及,相关的云计算厂商、光模块、铜缆等连接技术将持续受益。



02  


中游——模型商与数据服务商:闭源垄断不再,开源生态崛起



        

DeepSeek的开源选择与低廉定价,传达出了团队对于全球科技的美好愿景。相较于OpenAI这类希望凭借高额算力投入与技术垄断在AI领域占据优势的闭源公司,DeepSeek更希望看见的是“美美与共,世界大同”,即通过开源模式使高效低成本的模型能够服务于每一个开发者,达到互联网世界的“平权效应”,推动创新从巨头集中式研发转向社区分布式协作,为中小软件企业创造更多创新机会。


有数据显示,R1上线一个月衍生模型超670个,累计下载量达320万次。在DeepSeek的影响下,闭源厂商可能被迫跟进降价或转向微调支持等差异化服务。


对于数据服务商而言,DeepSeek使用14.8万亿token的多语言数据集,通过强化学习减少对人工标注的依赖,都凸显了高质量数据的重要性。此外,在美国发现“通过禁运高端AI芯片来制约中国的AI产业发展”这一措施即将无效后,可能还会通过对中国限制AI训练数据获取等措施来进一步限制中国大模型企业,这将利好国内的专业数据服务商。



03  


下游——AI应用软硬件提供商:成本红利释放,场景爆发在即



        

DeepSeek的高性价比,吸引了全球开发者涌入生态,形成“模型优化—用户体验提升—使用规模扩大”的正向循环,使得AI行业的投资逻辑从硬件基建转向应用场景,各行业垂直领域的AI软件工具及硬件设备将成为新热点。


AI Agent(智能体)是一种能够自主决策并执行复杂任务的智能系统,通过与用户和环境的交互完成多种场景下的任务。随着DeepSeek显著降低了大语言模型的使用门槛,AI Agent的应用前景变得更加广阔。


在toB端,典型的AI Agent如智能客服、办公自动化助手、学术研究助手、供应链管理助手等;在toC端,典型的AI Agent如日常生活助手、创意工作生成内容、游戏NPC等。


以前的AI Agent仍然存在局限于特定场景、功能受限等缺陷,但随着大模型调用成本的显著降低,更多中小企业可负担起智能体部署,生态将迎来快速扩张,甚至可以进行多场景互联、融合,智能体处理能力也迎来极大提升,从任务执行辅助工具升级为决策中枢。


对于AI智能硬件而言, DeepSeek不仅发布了具有超过 6800 亿个参数的主要大型模型,而且还发布了多个精简模型,这些模型的大小从 700 亿到 15 亿参数不等,后者可适用于许多消费级硬件,降低了智能产品的AI功能集成门槛,开发者可快速将其AI能力部署至硬件设备并针对场景定制化。


凭借高效推理能力和低延迟响应的能力,DeepSeek能提升智能硬件交互的流畅度和场景理解的准确度,增强交互体验,助力AI智能硬件的普及渗透,如AI手机、AI电脑、AI可穿戴设备包括眼镜/耳机等、AI玩具、AI机器人等产品。相应地,智能硬件中的边缘计算系统级芯片(SoC)、物联网模组及连接芯片等也将迎来需求增长。


对于细分行业来说,Deepseek将推动AI技术在各行业中的应用深化,金融、教育、广告、制造、零售和医疗行业等领域的企业将能够以更低的成本部署AI解决方案,从而提升效率和竞争力。


我们看到,DeepSeek模型已在教育(科大讯飞“星火助学”)、医疗(润达医疗诊断辅助)、金融(拓尔思舆情分析)等领域商用。但是,过于依赖第三方模型可能导致同质化竞争,所以具有独家场景数据的企业才能够构建技术护城河。DeepSeek已经探索出高效的模型训练方法,AI解决方案商的核心竞争力可能将从AI模型算法转向行业Know-how与数据积累。


DeepSeek的技术突破,标志着AI产业从“暴力堆料”转向“精耕细作”。上游算力厂商将迎来分化,中游模型商面临开源与闭源的路径抉择,下游应用商则迎来前所未有的创新窗口。随着推理需求爆发和端侧智能崛起,一个更多样、更普惠的AI新时代正在到来。


参考文件:


1.《DeepSeek 核心十问十答》,中信建投证券,2025年2月4日

2.《DeepSeek推进模型平权,加速AI应用繁荣》,华泰证券,2025年2月4日

3.《浅谈DeepSeek的成本和跟行业对比》,华泰证券,2025年2月4日

4.《DeepSeek 十问十答》,华泰证券,2025年2月4日

5.《“DeepSeek风暴”席卷全球资本市场,产业链企业谁是输家?谁是赢家?》,物联网智库,2025年2月7日


图片来源:unsplash.com/pexels.com,前两张图由即梦生成

产业|终局未定,“百模大战”未来何往




文章为作者独立观点,不代表JIC投资观察立场。






【声明】内容源于网络
0
0
中国建投
中国建投集团官方账号。
内容 510
粉丝 0
中国建投 中国建投集团官方账号。
总阅读207
粉丝0
内容510