大数跨境

NVIDIA英伟达 800G InfiniBand和以太网连接人工智能布线指南(二)

NVIDIA英伟达 800G InfiniBand和以太网连接人工智能布线指南(二) 康宁光通信
2024-10-12
1

NVIDIA英伟达 800G InfiniBand

和以太网连接人工智能布线指南




我们的NVIDIA 800G InfiniBand和以太网连接人工智能布线指南对200G、400G和800G收发器接口的各类光纤连接方案进行了深入研究。本文件详细说明了如何将400G NDR InfiniBand Quantum-2和400GbE Spectrum-4以太网交换机整合到光纤布线系统中。

随着800G和NVIDIA新型双MPO-8/12接口的出现,本人工智能布线指南阐述了NVIDIA光收发器模块和康宁EDGE8®解决方案如何促进人工智能和机器学习创新的发展。

我们的NVIDIA 800G指南第一章全面探究了点到点和结构化布线的各类应用,解释了如何采用这些布线策略使服务器与叶交换机互连,并促进交换机到交换机连接,适用于叶-脊或脊-核心交换机连接。本章还对适用于不同的网络设计的康宁公司各类零部件编号进行了详细说明。

第二章深入讨论了NVIDIA DGX SuperPOD的布线策略。本章以NVIDIA DGX H100作为参考,解释了如何调整类似的布线部件和基础设施,以适应其他DGX模型;它还阐述了可扩展单元(SU)的配置如何决定SuperPOD的结构和GPU的总数。本章强调了POD或集群的大小在决定所需InfiniBand叶、脊和核心交换机数量以及所需光缆或连接数量方面发挥的关键作用。



与传统服务器机架相比,这种神经网络在相同空间中所需的光纤数量,是传统服务器机架所需光纤数量的10倍以上。多年来,康宁一直在为这种超大规模数据中心的发展做准备。我们发明了新的光连接方案,可帮助数据中心运营商迅速改进和运行这些密集的下一代GPU集群。今天,我们正携手全球领先的超大规模数据中心运营商部署这些解决方案——开创生成式人工智能时代。


目录


向上滑动阅览目录

1.

了解收发器类型、端口拆分和布线场景

1.1.

场景1 - 800G和400G - 服务器到交换机应用 MPO-8/12 APC

1.2.

场景2 - 800G和400G - 交换机到交换机应用 MPO-8/12 APC

1.3.

场景3 - 800G和200G - 服务器到交换机应用 MPO-8/12 APC

1.4.

场景4 - 800G和200G - 交换机到交换机应用 MPO-8/12 APC

1.5.

场景5 - 800G和400G -交换机到交换机应用,点对点 LC-双工UPC

1.6.

场景6 - 800G和400G -交换机到交换机应用,连接数据中心的 LC-双工UPC

1.7.

每个场景的收发器选项和端口拆分连接

2.

NVIDIA DGX SuperPOD布线架构参考指南

2.1.

了解DGX-H100节点(服务器)的计算网络连接

2.2.

了解Quantum-2 9700 NDR IB交换机 

2.3.

理解SuperPOD的构建块——可扩展单元的概念

2.4.

在NVIDIA DGX SuperPOD中实现布线场景

2.4.1

A级-服务器到叶节点的布线

2.4.2

B级-叶节点到脊节点的布线

2.4.3

C级-脊节点到核心的布线

2.5.

多模 vs 单模

2.6.

整体概览

2.6.1

4可扩展单元(SU)集群/POD的布线

2.6.2

8可扩展单元(SU)集群/POD布线

2.6.3

16可扩展单元(SU)集群/POD的布线

2.6.4

32可扩展单元(SU)集群/POD的布线

2.6.5

 64可扩展单元(U)集群/POD的布线

2.7.

结论

附件1 

高密度机箱

附件2 

极性图纸

场景1

800G和400G - 服务器到交换机应用MPO-8/12 APC.

场景2

800G和400G -交换机到交换机应用MPO-8/12 APC.

场景3

800G和200G - 服务器到交换机应用MPO-8/12 APC.

场景4

800G和200G - 交换机到交换机应用MPO-8/12 APC.

场景5

800G和400G - 交换机到交换机应用,点对点 LC-双工UPC.

场景6

800G和400G - 交换机到交换机应用,数据中心内的 LC-双工UPC.

附件3

参考文献和联系方式

已到底部


1.4.场景4 - 800G和200G -

 交换机到交换机应用

使用结构化布线,通过主干光缆在数据中心内连接MPO-8/12 APC到MPO-8/12 APC

应用:Quantum-2 InfiniBand或Spectrum-4以太网到ConnectX-7 / Bluefield-3

场景4与结构化布线组件一起使用,其中400G收发器版本将能够通过使用分路光缆(Y型跳线)来支持200G,该光缆可以激活400G收发器中四条通道中的两条(8芯光纤中的4芯),从而有效地连接200G设备。在此场景中,有源设备物理上位于数据中心内的不同区域。


请参考表9第1.7节,查看场景3和场景4中适用于用例A和B的收发器列表。要了解更多关于可扩展单元以及如何构建DGX SuperPOD的信息,请参考本文档中的第2节。


图4. 使用800G和200G收发器与MPO-8/12 APC适配工作的结构化布线用例


表5. 场景4-使用结构化布线与MPO-8/12 APC的 800G和 200G部件编号方案

a) 美洲地区的康宁光缆使用Plenum光缆,而EMEA/APJ地区使用LSZH™/CPR额定光缆。单跳线长度从1米到300米不等。束状跳线采用网状套管。长度从10米到300米不等(分叉点到分叉点),以5米为增量,光缆束可提供16根、32根以及自定义数量的光纤分支,分支长度可以是相等的或不等的。美洲地区也提供以米为单位的长度选项。

b) 主干缆有8到288芯光纤的规格。

c) 康宁光缆支持InfiniBand、以太网和NVLink协议。


1.5.场景5 - 800G和400G - 

交换机到交换机应用

使用点对点连接的LC双工到LC双工

应用:Quantum-2 InfiniBand或Spectrum-4以太网到a) Quantum-2 InfiniBand或Spectrum-4以太网。

场景5主要用于点对点布线应用,它涉及连接位于同一机架或同一机柜内的有源设备。但是,如果这些设备物理上位于数据中心内的不同区域,则不建议使用点对点布线。


LC双工收发器的主要应用是将Quantum-2或Spectrum-4风冷交换机连接在一起,收发器上的亮绿色标记表示最大连接距离可达2km。

请参阅表10第1.7节,查看场景5和6中适用于用例A和B的收发器列表。要了解有关可扩展单元以及如何构建DGX SuperPOD的更多信息,请参阅本文档中的第2节。


图5. 使用800G和400G收发器,结合LC双工的点对点布线用例


表6. 场景5 - 使用点对点布线与LC双工的 800G和 400G部件编号方案

a) 美洲地区的康宁光缆使用Plenum光缆,而EMEA/APJ地区使用LSZH™/CPR额定光缆。单跳线长度从1米到300米不等。美洲地区也提供以米为单位的长度选项。

b) 康宁光缆支持InfiniBand、以太网和NVLink协议。


1.6. 场景6 - 800G和400G - 

交换机到交换机应用

使用结构化布线,通过主干光缆在数据中心内连接LC双工到LC双工

应用:Quantum-2 InfiniBand或Spectrum-4以太网到a) Quantum-2 InfiniBand或Spectrum-4以太网。

在场景6中,结构化布线的实现利用MPO-8/12光缆作为主干光缆。该应用用于连接不同的交换 机,例如叶交换机到脊交换机。当两个不同的有源设备物理上位于数据中心内的不同区域时,推荐使用该选项。


LC双工收发器的主要应用是将Quantum-2或Spectrum-4风冷开关连接在一起。收发器上的亮绿色标记表示最大连接距离可达2km。

请参阅表10第1.7节,查看场景5和6中适用于用例A和B的收发器列表。要了解有关可扩展单元以及如何构建DGX SuperPOD的更多信息,请参阅本文档中的第2节。


图6. 使用800G和400G收发器,结合LC双工的结构化布线用例


表7. 场景6 - 使用结构化布线,结合LC双工连接的 800G和 400G在主动设备上的部件编号方案

a) 美洲地区的康宁光缆使用Plenum光缆,而EMEA/APJ地区使用LSZH™/CPR额定光缆。单跳线长度从1米到300米不等。美洲地区也提供以米为单位的长度选项。

b) 主干缆有8到288芯光纤的规格。

c) 康宁光缆支持InfiniBand、以太网和NVLink协议。


后台留言联系我们,获取更多详细信息

未完待续

相关阅读

NVIDIA英伟达 800G InfiniBand和以太网连接人工智能布线指南(一)




【声明】内容源于网络
0
0
康宁光通信
我们的创新光学连接解决方案为企业、运营商以及无线市场带来了高质量宽带能力,同时扩展了消费电子设备的前沿领域。
内容 225
粉丝 0
康宁光通信 我们的创新光学连接解决方案为企业、运营商以及无线市场带来了高质量宽带能力,同时扩展了消费电子设备的前沿领域。
总阅读63
粉丝0
内容225