大数跨境

趋势丨存储墙破局:HBM光互连,GPU算力的下一个拐点

趋势丨存储墙破局:HBM光互连,GPU算力的下一个拐点 AI芯天下
2026-05-30
11
导读:2026年的AI算力竞赛,正在步入一个危险的“深水区”。

作者 | 方文三

图片来源 | 网络

前言:2026 年的 AI 算力竞赛,正在步入一个危险的“深水区”。当 GPU 芯片的 AI 性能每代跃升数十倍时,其搭档 HBM 高带宽内存的带宽增速,却逐渐逼近物理极限。随着 HBM4 堆叠层数逼近 16 层,散热和信号完整性正成为难以逾越的障碍。就在这个尴尬的节点,一场激进的架构革命悄然浮出水面:将 HBM 与 GPU 物理分离,再用“光”而非铜线连接它们。

HBM 的“内卷”:带宽与容量的双重天花板

过去十年,HBM 凭借芯片堆叠与增加数据通道,成为 AI 服务器中不可或缺的“带宽王”。然而 2026 年后,这条路正慢慢走不通了。业界普遍认为,随着 HBM 堆叠层数继续向更高层发展,制程难度呈指数级上升,有限的物理边界决定了 AI 芯片周围能塞下的 HBM 颗粒数量是有天花板的。

与此同时,散热问题也成了“拦路虎”,服务器内部的功耗密度正在失控。当模型参数万亿级增长时,HBM 提供的 3.3TB/s 带宽在大模型键值缓存面前已然捉襟见肘。存储增长速度大幅落后于算力增长速度,这堵“存储墙”正直接锁死大模型推理的速度,成为算力竞赛里的结构性短板。

光互连的革命:从“铜线”时代跨入“光子”时代

为了突破物理限制,半导体和封装产业链提出了一种大胆的新思路:光互连。与传统的电信号传输容易受电磁干扰、随着频率升高损耗剧增不同,光信号天然具备“低功耗、长距离、高带宽”的独特优势。

具体到 HBM 场景,这项技术旨在颠覆原有的 2.5D 封装逻辑。未来,GPU 与 HBM 将不再紧密贴在同一个硅基板上,而是分开封装。原先紧贴着 AI 芯片周围的 HBM 会被挪开,然后透过超高速光学互连进行数据交换。过去业界深信“芯片之间必须紧挨着才能降低延迟”,但光互连的极致速度克服了物理距离带来的延迟问题,从而可以在电路板上安装比现行架构多出数倍的 HBM 容量,真正做到“既要容量、又要带宽”。

在这场革命中,台积电走在了最前线。它首次提出的 AI 芯片“三层蛋糕”理论,明确将光子与光学互连定义为“未来最重要”的第三层。其研发的 COUPE 技术采用了 3D 异质集成方式,利用 SoIC(系统整合芯片)工艺将电子芯片和光子芯片垂直堆叠,大幅缩短互连距离。相比传统铜线,该技术能让系统能效直接提升 4 倍,延迟降低 10 倍。该技术已在 2026 年实现规模化量产,标志着共封装光学(CPO)产业链正式从验证阶段走向商业化部署。

产业链“梭哈”:群雄逐鹿光互连新赛道

面对这块颠覆性的蛋糕,不仅是台积电,全球 AI 芯片巨头们也纷纷将“光互连”写入了未来两至三年的路线图。

AMD 已经率先“亮剑”。它正联合晶圆厂格芯以及封装大厂日月光,为其 2027 年发布的下一代 Instinct MI500 AI 加速器开发基于微环调制器的 CPO 方案。光子集成电路由格芯制造,日月光负责封装,AMD 去年收购的硅光子初创公司 Enosemi 将负责加速相关技术创新。搭载 2nm 工艺、CDNA 6 架构和 HBM4E 内存的 MI500,性能目标是实现四年上千倍增长。

老对手英伟达同样紧追不舍。据悉,英伟达为 Vera Rubin 加速器推进的 CPO 方案,PIC(光子集成电路)由台积电制造,矽品精密负责封装。在下一代 Rubin Ultra 中,CPO 方案将优先于 NPO(近封装光学),而在更遥远的 Feynman 世代,AI 加速器将全面转向 CPO,彻底淘汰对传统铜线互连的依赖。

除了这几大芯片巨头,整个上游产业链也动了起来。博通在 2026 年 OFC 期间推出业界首款 400G/lane 光学 DSP 解决方案 Taurus,早已为其下一代的以太网交换芯片预埋了光学接口的“基因”。英特尔则以“硅光+OCI(光计算互连)”为核心,打造芯片级超低功耗光 I/O,卡位 AI 超算集群的下一代互联架构。而中国厂商也不甘示弱:曦智科技今年 4 月登陆港交所,成为“全球 AI 硅光芯片第一股”,它联合产业伙伴推出的全球首个分布式光交换光互连 GPU 超节点解决方案,解决了大规模算力集群中传统电互连的带宽瓶颈与扩展性受限等挑战。海思光电则推出了高密光引擎 Hi-ONE,号称具有低功耗、低成本、低时延的优势,适配可插拔、板载、共封装等多种应用场景。

从“电”到“光”的万亿级财富转移

随着产业链集体转向,市场资金的嗅觉最为灵敏。有分析指出,AI 系统的瓶颈正从 HBM 内存(2024 年的卡点)向光互连转移(2026-2028 年的卡点),但以 AI 为主题的基金普遍在这个板块“买得不够”。

这种结构性转变不仅意味着一场技术革命,更伴随着一波巨大的财富转移。过去几年吃尽红利的 HBM 厂商,面对的是即将见顶的物理天花板;而掌握“光互连”新钥匙的上游通信商与封装厂,则迎来了属于自己的“黄金时代”。预计到 2030 年,仅 CPO 这一细分领域的全球市场规模就有望突破 100 亿美元。在此浪潮下,国内的源杰科技、长光华芯、中际旭创,以及海外的 Lumentum、Coherent 等光器件龙头,都有望成为这场变革的受益者。

结语

当先进制程带来的红利逐渐减小,“架构创新”正接过拉动 AI 算力的接力棒。未来两到三年,无论是 AMD 与英伟达的“光芯片”落地,还是台积电 COUPE 生态的爆发,都将彻底改写 AI 硬件的功率密度和数据传输效率。2026 年,将成为连接 AI“电”与“光”的世纪分水岭——而那个被忽视已久的“内存墙”,终于要被推倒了。

网络援引:

三思派:《从“无限 AI 算力循环”看人工智能基础设施竞争的新逻辑》

新浪财经:《内存堆叠达极限!传 HBM 不再紧贴 GPU,改走「光学互连、分离封装」新架构》

新财富杂志:《存储产业链投资机遇 | 研报精选》

【声明】内容源于网络
0
0
AI芯天下
聚焦人工智能,AI芯片,5G通讯等行业动态
内容 5585
粉丝 0
AI芯天下 聚焦人工智能,AI芯片,5G通讯等行业动态
总阅读74.1k
粉丝0
内容5.6k