大数跨境
0
0

Nubis|理解CPX技术在AI集群中的应用

Nubis|理解CPX技术在AI集群中的应用 逍遥设计自动化
2025-09-05
0
导读:现代人工智能系统对计算能力和数据吞吐量提出了极高要求,为数据中心基础设施带来全新挑战。随着AI工作负载复杂性不断增长,传统的处理单元互连方法正在接近性能极限。本文深入探讨光电共封装技术,特别是CPX范

引言



现代人工智能系统对计算能力和数据吞吐量提出了极高要求,为数据中心基础设施带来全新挑战。随着AI工作负载复杂性不断增长,传统的处理单元互连方法正在接近性能极限。本文深入探讨光电共封装技术,特别是CPX范式如何应对这些日益严峻的挑战[1]。

01

AI计算中的带宽危机

AI处理单元需要海量数据才能有效执行计算任务。当我们分析计算强度与系统性能之间的关系时,会发现一个清晰的模式,揭示了现代AI系统对带宽的巨大需求。

图1:展示了AI引擎如Nvidia B200相比传统处理器需要数量级更高的I/O带宽,显示了从简单计算到复杂计算在不同处理架构中的演进过程。


AI算法的运算强度特性构成了根本性挑战。与传统计算任务可能只处理数据一次就丢弃不同,AI工作负载需要在内存和处理核心之间持续传输大量数据。这种情况下,互连带宽成为主要瓶颈,而非原始计算能力。


当前AI集群面临这一挑战的特别严峻版本。现代图形处理单元和专用AI加速器的数据处理速度远远超过传统电气互连的数据供应能力。处理能力与数据传输之间的不匹配造成了影响整个系统的效率损失。


02

数据中心互连技术的发展历程

数据中心网络基础设施在过去二十年中经历了显著发展,这一进程由带宽需求的持续增长所驱动。高速串行器-解串器线路已成为现代数据中心通信的基础货币。

图2:展示了从2000年到2030年交换机容量和单通道交换机I/O的指数增长,显示交换机容量年增长率为40%,单通道速度年增长率为20%,预测将发展到每通道400G。


这一发展轨迹没有放缓迹象,当前200G单通道技术预期将向400G实现方式演进。这种持续扩展为系统设计师创造了机遇和挑战。机遇在于巨大的带宽潜力,挑战则涉及管理随之而来的功耗和复杂性。


混合介质支持已成为实际实现的关键要求。行业采用了"能用铜线就用铜线,必须用光纤才用光纤"的理念,根据距离要求优化成本和功耗。


03

功耗问题:规模化的隐形成本

AI集群设计中最重要但常被忽视的方面之一涉及互连系统的功耗。网络基础设施可能消耗集群总功率预算的巨大部分,有时占整个系统能耗的一半以上。

图3:对比图显示1.6T重定时光学器件30W功耗与1.6T无源铜线0W功耗之间的巨大差异,说明重定时器DSP功耗在大型集群运营中造成数十亿美元成本。


当考虑基于重定时器的解决方案时,功耗挑战变得尤为严峻。光学重定时器中使用的数字信号处理芯片可能消耗大量电力,在大型AI集群中乘以数千或数万个连接时,累积效应变得惊人。这种功耗直接转化为运营成本,在大型安装的生命周期内可能达到数十亿美元。

图4:混合介质选项的完整范围,包括10W的1.6T线性光学器件和2.5W的1.6T有源铜线,展示了为实现功耗高效运营而避免使用重定时器DSP的必要性。


解决方案涉及为集群内每个距离范围仔细选择适当的互连技术。无源铜缆在极短距离内工作出色,有源铜线在保持低功耗的同时扩展了传输距离,线性光学器件提供长距离能力而无需承担重定时器的功耗代价。


04

扩展挑战与架构解决方案

大型AI集群带来了传统网络方法难以有效解决的独特扩展挑战。大规模处理器数量、高单处理器带宽要求和全连接需求的结合创造了复杂的优化问题。

图5:综合对比表显示了混合介质AI集群示例,对比了150k和600k个xPU的配置,展示了通过正确技术选择在五年内可实现3.2亿至38亿美元的潜在节省。


扩展数学计算毫不留情。拥有数十万处理单元的集群,每个单元需要每秒数十太比特的带宽,创造的聚合带宽需求对传统网络架构构成挑战。交换机和互连消耗的总集群功率百分比可能因技术选择而大幅变化,从总系统功率的37%到61%不等。


这些扩展挑战推动了对新架构方法的需求,这些方法能够在支持现代AI工作负载的大规模连接要求的同时保持效率。解决方案涉及超越传统范式,转向将光学和电气组件共同定位的更集成方法。


05

光电共封装技术的优势

光电共封装技术代表了AI系统高速互连方法的根本性转变。CPO不是将光收发器视为独立的可插拔模块,而是将光学组件直接与处理和交换硅器件集成。

图6:光电共封装铜线和光学器件通用连接器方法的示意图,展示了支持铜线和光连接的6.4T可拆卸连接器系统,具有无重定时器线性接口能力,功耗为每太比特5瓦。


这种集成为AI集群设计提供了几个关键优势。消除重定时器数字信号处理器显著降低了功耗,同时提高了密度。该方法保持与现有铜基解决方案的兼容性,同时提供向更高性能光学实现的迁移路径。


CPX范式通过创建标准化的多供应商生态系统扩展了这些优势,复制了在前面板应用中为行业服务良好的成功可插拔模块方法。这种标准化确保了互操作性,同时保持了快速技术演进所需的灵活性。


06

密集化需求与SerDes避免重定时DSP

为了实现功耗高效的AI I/O,必须接近SerDes的密度水平。当前OSFP 1.6T连接器的I/O密度为0.14 Tbps/mm,而200G SerDes可达到1.5 Tbps/mm。

图7:功耗高效AI I/O需要接近SerDes密度的要求,显示了从传统1D边缘连接到2D阵列的5-10倍I/O密集化需求,实现更短的板上走线、更密集的系统和更短的电缆。


实现5到10倍的I/O密集化带来多重好处。更短的板上走线减少了信号完整性问题,更密集的系统降低了空间要求,更短的电缆减少了成本和功耗。这种密集化消除了对重定时器DSP的需求,从而实现了更高效的系统架构。


07

2D阵列技术的应用

2D阵列技术为可扩展高密度I/O提供了关键能力。传统的1D边缘耦合方法在电气和光学应用中都受到物理限制的约束。

图8:对比了传统1D边缘耦合与2D阵列方法,电气连接从1D边缘发展到2D阵列,光学连接从传统边缘耦合16根光纤发展到表面耦合48根光纤,两者都实现了5-10倍的密度改善。


2D阵列方法在电气和光学领域都提供了显著的密度改善。电气连接通过2D阵列实现更高的引脚密度,光学连接通过表面耦合技术支持更多光纤的并行连接。这种方法为下一代高性能互连系统奠定了技术基础。


理解这些互连挑战和解决方案对于AI系统持续扩展至更大集群规模和更高性能要求具有重要意义。从传统电气互连到光电共封装解决方案的转变不仅代表技术演进,更是对现代人工智能计算基本要求的必要适应。


参考来源


[1] "CPX – Operationalizing CPO for AI Clusters," presented at Hot Interconnects, Aug. 2025.

END


NOTICE



软件试用申请
欢迎光电子芯片研发人员申请试用PIC Studio,其中包含:代码绘版软件PhotoCAD,DRC软件pVerify,片上链路仿真软件pSim,光电融合与光纤系统仿真软件pSim+等。更多新功能和新软件将于近期发布,敬请期待!

点击左下角"阅读原文"马上申请


欢迎转载


转载请注明出处,请勿修改内容和删除作者信息!




关注我们



                      




关于我们:

深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。


http://www.latitudeda.com/

(点击上方名片关注我们,发现更多精彩内容)

【声明】内容源于网络
0
0
逍遥设计自动化
分享特色工艺半导体(PIC/MEMS/Power/3D IC)设计自动化解决方案及行业技术资讯,与广大客户、专家共同交流、共同进步!
内容 1743
粉丝 0
逍遥设计自动化 分享特色工艺半导体(PIC/MEMS/Power/3D IC)设计自动化解决方案及行业技术资讯,与广大客户、专家共同交流、共同进步!
总阅读720
粉丝0
内容1.7k