大数跨境
0
0

SuperNIC Cx-8方案落地实测后的深层解析&数据共享

SuperNIC Cx-8方案落地实测后的深层解析&数据共享 Byte-哈哈摩
2025-11-27
0
导读:🚀 背景介绍前面分享了一篇Hotchips 2025 CX8 (ConnectX-8) SuperNIC的文

🚀 背景介绍

前面分享了一篇Hotchips 2025 CX8 (ConnectX-8) SuperNIC的文章,主要是从应用场景AI训练和推理对网络策略的要求、CX-8的技术规格、新技术、架构等方面来引出介绍整体的一个性能提升。

本篇主要基于 CX-8落地服务器的整机配置,通过Topo、具体的CX-8 lanes资源分配、某些实测数据等方面,更立体、详细地将CX-8的PPT性能数据完美复刻

备注:调优类细节性不会共享(过于先进,不便展示)、也不要私信,感谢理解。

🚀🚀 硬件Topo介绍

  1. CX-8 Topo展示

    从CX-8的规格书中可知每个芯片的Host/IO Interface48Lanes PCIe Gen6 Integrated PCIe Switch。如上图所示,每个CX-8 有16条lane作为上行口,就是连接到CPU的那一组,然后有32条lanes是作为下行口,用来连接两个GPU设备(Gen5 or Gen6)。所以一个CX-8 SW板有四个芯片,一共可以挂4*2=8块GPU设备。另外每个SW芯片有一个CX-8网卡,提供给同sw下的GPU设备进行数据收发。

  2. OS下的Topo展示

    Pcie Tree:

    nvidia-smi topo -m

🚀🚀🚀实测性能表现

    1. GDR实测数据


    2. NCCL数据




    <END—欢迎点赞+关注>
    🔍 “打伤博主” 会加快更新频率哦~


    【声明】内容源于网络
    0
    0
    Byte-哈哈摩
    你的每一次进步,都是重要的一 byte❤️
    内容 25
    粉丝 0
    Byte-哈哈摩 你的每一次进步,都是重要的一 byte❤️
    总阅读16
    粉丝0
    内容25