(全文约3200字,预计阅读时长6分钟)
随着人工智能技术浪潮席卷全球,算力已成为驱动这场革命的核心引擎,堪比新时代的“石油”。然而,当全球AI竞赛日益白热化,算力的自主可控已不仅是技术问题,更是关乎产业安全与国家竞争力的战略命题。过去,全球高端算力市场由少数国际巨头主导,存在供给与供应链风险。如今,中国正逐步构建起一条自主可控、且具备全球竞争力的AI算力产业链,开始定义自己的游戏规则。从芯片硬件到软件生态,从“单点突破”到“全栈协同”,国产力量正经历怎样的战略转型?东方红资产管理权益研究部TMT组资深研究员张明宇将深入剖析国产AI芯片产业链的行业格局及发展趋势,与您分享他的思考。
为何算力成为AI竞赛的“胜负手”?
在人类文明的演进史上,每一次技术革命都伴随着关键生产要素的转移。在蒸汽时代是煤炭,在电气时代是石油和电力,而在智能时代,这个角色无疑由“算力”扮演。
当我们惊叹于AI生成文案、绘制图像、构建复杂模型的能力时,其背后是海量数据与复杂算法在强大算力支撑下的高速运算。算力离不开三种核心芯片:GPU、FPGA、ASIC。它们各司其职,共同构成了算力的“三叉戟”:
图:GPU、FPGA、ASIC
(图片由AI生成)
过去,高端芯片市场几乎被国际巨头英伟达垄断,国内企业常面临“一卡难求”的局面。然而,地缘政治的不确定性与供应链安全风险,让“卡脖子”的痛感愈发强烈。这催生了中国市场对国产算力的迫切需求,也为本土产业链的崛起提供了历史性的“黄金窗口期”。近年来,一批国产力量奋起直追,不仅在芯片性能上不断突破,还瞄准了更高的目标:构建属于自己的产业链全栈能力。
真正的较量:
从“造芯片”到“建生态”的升维之战
硬件的追赶只是上半场,国产算力要实现真正的突围,生态的构建才是决胜的关键。
正如苹果的成功不仅依赖A系列芯片,更得益于其软硬件、操作系统与应用商店生态的系统性整合,从而创造了无缝的用户体验与强大的开发者生态。
英伟达的强大也不仅在于其GPU芯片的物理性能,更在于其构建了CUDA生态系统。这套体系让全球大量AI开发者习惯于在其平台上进行编程、优化和部署,形成了极高的迁移成本和用户粘性。
对于芯片产业而言,真正的护城河,在于构建一个能让开发者们“用得好、离不开”的生态系统。为此,国产力量正在探索一条独具特色的生态建设路径。
路径1:自建生态,打造“中国版CUDA”
一些国产芯片厂商意识到,必须建立自主可控的软件栈才能在市场中拥有足够的话语权。以华为为例,他们推出了“CANN + MindSpore”组合拳,CANN作为底层计算架构,负责将上层AI框架的计算任务高效转化为芯片指令;而MindSpore则作为面向开发者的AI框架,提供从模型开发、训练到部署的全流程支持。由于软硬件均由同一体系设计,可以实现深度的性能优化,在部分特定任务上的效率已可比肩甚至超越国际主流框架。另一家AI芯片独角兽企业也推出了包含自研编程语言、推理引擎在内的“全家桶”解决方案,专注于提升大模型部署的效率。
尽管这些自建生态在成熟度和开发者规模上尚在成长期,但已经能“跑通”和兼容很多关键任务,为关键领域的自主可控应用奠定了坚实基础。
路径2:兼容主流算法体系,降低开发者迁移成本
与其让开发者放弃熟悉的工具、学习全新的体系,不如为他们提供一个“无缝切换”的选项。这对于国产算力而言,或许是一种更为务实的策略。
国内如飞桨(PaddlePaddle)、PAI等AI平台,以及华为推出的Ascend-PyTorch插件,都体现了这一思路。它们允许开发者使用业界通用的PyTorch等框架编写代码,只需少量修改甚至无需修改,即可在国产芯片上进行训练和推理。
这种兼容模式极大地降低了开发者的试错门槛和迁移成本,加速了国产算力在学术研究和商业应用中的渗透,成为可靠的可选项,并逐步扩大生态影响力。
通信突围,从“单点突破”到“系统协同”
随着“超节点”时代的到来,大模型参数量爆发式增长,AI训练动辄需要数千颗芯片协同工作。如何将这些芯片高效地组织起来,让它们像一支训练有素的军队一样协同作战,其重要性甚至超过了单兵作战能力。
图:华为昇腾384超节点
英伟达通过InfiniBand(IB)网络和NVLink芯片互联技术,实现了“芯片+网络+软件”三位一体的高效协同,实现了芯片间超高速的数据交换,这是其大规模集群算力领先的关键。国产算力则从两个方向破局:
1)自研互联与系统级创新
例如华为发布的Atlas A800-384系统,是全球少数能实现单机柜集成数百颗芯片的AI集群之一。这并非硬件的简单堆砌,而是系统级创新。其背后通过自研的互联技术提升芯片间高速通信,通过液冷与风冷混合的先进散热方案保障了高密度部署下的能效比,并通过软件层“感知”整个集群的物理拓扑,智能地进行任务分配和并行计算,大幅降低了通信开销。
2)拥抱开放标准,构建开放联盟
国内企业正联合推动UALink标准,旨在建立一个不依赖单一厂商的开放互联生态。基于此标准,一些国内企业已成功研制出搭载上百颗芯片的超节点服务器,理论互联带宽已达到业界领先水平。这标志着国产算力已经从“模仿单卡性能”,进入到“探索更适合大模型时代的新型基础设施”的全新阶段。
国产算力发展的“黄金期”:
政策、需求与供应链的多重共振
当前正迎来由国家战略、市场需求与技术进步多轮驱动的"黄金期",多重积极因素共振,推动国产算力发展按下加速键。
1)国家战略的强力牵引:“东数西算”工程的全面推进,正加速构建全国一体化的算力网络,为国产算力提供了广阔的应用市场。“十四五”规划亦明确指出打造“数字经济新优势”“建设数字中国”,各地政府纷纷出台补贴政策,鼓励企业采购和使用国产算力,形成了强大的政策推力。公开数据显示,2025年中国通用算力规模预计增长20%,智能算力规模增长43%,排名全球第二。近五年来,算力总规模增速每年都高达30%。澎湃算力,正为中国经济发展积蓄新的更强劲动力。
图:“东数西算”工程布局图
图片来源:国家发展改革委官网
2)算力需求的井喷式增长:各行各业对AI需求爆发的同时,算力的Transformer架构与“Scaling Law”(缩放定律)使得大模型训练算力需求呈指数级增长,国内外资本开支投入持续加码,也为国产算力芯片提供了持续迭代和优化的“练兵场”。一个正向迭代的飞轮正在形成:更多企业试用国产芯片 → 发现问题并反馈 → 芯片性能与生态稳定性快速提升 → 吸引更多企业采购。
资料来源:Our World in Data,Sevilla et al.(2022);
3)供应链安全的内在需求:国际环境的变化,让越来越多的企业,特别是关键行业的龙头企业,将供应链安全置于前所未有的高度。采购国产算力,已从过去的“可选项”逐渐变为“必选项”,这为国产厂商提供了宝贵的市场准入和成长机会。
今天的国产算力,正在摆脱“能用就行”的备胎标签,逐步探索更适合大模型时代的新型基础设施,努力实现从“可用”到“好用”再到“领先”的蜕变。
这场变革的核心,是从硬件替代走向系统定义,从被动追赶走向主动突围。未来的赢家,不再是仅仅掌握某项核心芯片技术的公司,而是那些能够整合芯片、网络、软件和生态的“系统建筑师”。这些默默打造中国人工智能底座的“卖铲人”,或许才是这场智能革命中最值得被看见的力量。对于投资者而言,理解并识别出那些具备全栈协同能力、拥有系统级创新思维的产业链关键节点,将是把握AI投资机遇的核心所在。它们的价值,将在AI浪潮的持续奔涌中得到市场的最终重估。

