华为全联接大会披露昇腾AI芯片路线图及超节点规划
文|李赫然 田宇昊
2025年9月18日,华为全联接大会召开,公司轮值董事长徐直军强调算力对人工智能发展的关键作用,并首次明确披露昇腾系列AI芯片发展路线图与超节点技术进展。
昇腾AI芯片迭代节奏清晰,性能持续升级
华为公布昇腾芯片未来三年规划:预计2026年Q1推出昇腾950PR(支持自研HBM),Q4推出昇腾950DT;2027年和2028年Q4将分别发布昇腾960、970。性能方面:
- 昇腾950PR:采用SIMD/SIMT架构,互联带宽达2TB/s,算力目标为1 PFLOPS FP8、2 PFLOPS FP4;
- 昇腾960:采用SIMD/SMT架构,互联带宽提升至2.2TB/s,算力达2 PFLOPS FP8、4 PFLOPS FP4;
- 昇腾970:同样采用SIMD/SMT架构,互联带宽提升至4TB/s,算力目标为4 PFLOPS FP8、8 PFLOPS FP4。
整体来看,昇腾系列在架构设计、数据类型支持、内存容量、互联带宽等方面持续优化,展现出向高性能、高灵活性和高适应性演进的趋势,有望满足日益复杂的AI训练与推理需求。
超节点技术突破,构建万卡级算力底座
在系统级算力布局上,华为发布全球领先的大规模超节点产品:
- Atlas 950 SuperPoD:支持8192张昇腾AI加速卡;
- Atlas 960 SuperPoD:支持15488张昇腾卡,在卡规模、总算力、内存容量和互联带宽等核心指标上全面领先。
同时,华为推出全球首个通用计算超节点TaiShan 950 SuperPoD,结合GaussDB分布式数据库,可替代传统大型机、小型机及Exadata数据库一体机,拓展AI算力至通用计算场景。
关键技术层面,华为基于三十余年联接积累,自主研发新型互联协议——灵衢(UnifiedBus),有效解决大规模集群互联瓶颈,支撑万卡级超节点架构。目前灵衢2.0技术规范已开放,Atlas 960 SuperCluster等新一代超节点产品正在研发中。
国产算力加速迭代,自主可控趋势确立
此次大会明确了昇腾芯片以“年为单位”的迭代节奏,标志着国产AI芯片从单点突破迈向系统化、可持续的生态建设阶段。尽管受外部制约影响,单芯片性能与国际领先水平存在差距,但华为通过强化系统协同与高速互联技术创新,显著提升集群效率与时延表现,具备支撑万卡级大模型训练的能力。
在地缘政治背景下,海外AI芯片供应不确定性增加,国内云厂商资本开支仍保持增长,反映出国产算力替代进程稳步推进。阿里等头部厂商已加快追赶北美AI技术步伐,预计后续更多企业将加大投入,推动国内算力重回高增长轨道。
投资建议:关注华为昇腾产业链核心环节
随着昇腾系列芯片与超节点方案加速落地,国产AI算力基础设施逐步成熟。建议重点关注三大方向:
- 互联生态:包括高速接口、交换芯片、光模块等相关配套;
- 超节点系统:涵盖整机集成、集群调度与软件栈支持;
- 液冷与电源:高密度算力下的散热与供电解决方案。
风险提示
AI技术发展应用不及预期;国内新型基础设施建设推进缓慢;相关政策落地存在不确定性;云厂商及运营商资本开支低于预期;地缘政治带来的供应链风险。

