为了解决这些限制,提出将光线路交换机集成到BCube拓扑中,以创建具有所有维度全对全直接连接的可重构多维网络,与混合并行的流量模式对齐以提高带宽利用率。BCube(n, k)是一个递归定义的网络拓扑,其中k是交换机端口数,n是拓扑中的维度数。基本单元BCube(n = 1)通过将k个服务器连接到一个k端口电子分组交换器来构建。对于OCSBCube,用光线路交换机替换每个电子分组交换器,用GPU替换每个服务器,GPU配备可控光链路,这些链路通过嵌入式光收发器均匀分布在n个维度上。在每个维度内,每个链路连接到不同的光线路交换机。
一般的OCSBCube(n, k, l)由k端口光线路交换机构成,连接k个OCSBCube(n - 1, k, l),总共有p = k^n个GPU和n级光线路交换机。OCSBCube(n, k)的直径为n,通常很小(例如,n = 2或3),因为端点数量随n呈指数增长。当每个维度的链路数大于或等于k - 1时,OCSBCube在每个维度中连接的GPU之间提供直接的全对全光连接。这有效地实现了具有n个维度的广义扁平蝶形拓扑,允许每个GPU直接与n(k-1)个对等体通信。
默认情况下,GPU注入带宽(即光纤)在n个维度上均匀分布。然而,正常BCube中的带宽不能跨维度重构,当流量模式需要跨维度的不均匀带宽时,会导致带宽利用不足。因此,提出使用波长可重构多端口收发器来替换GPU上嵌入的多个收发器。这种收发器设计利用密集波分复用梳状激光器技术提供的大量波长并行性,能够跨不同光纤重构波长,从而在网络边缘实现动态带宽分配。通过参数ε ∈ [0, 1]来表征边缘可重构性的程度,该参数反映了跨链路波长分配的灵活性。较高的ε表示更大的波长分配灵活性但成本增加,反之亦然。
使用这个参数,可以定义可分配给每个域的最大带宽为每个维度默认带宽的(1 + ε)倍。当没有边缘可重构性(ε = 0)时,OCSBCube(n = 2)中可分配给维度的最大带宽是总注入带宽的一半。相比之下,当所有带宽都可以从一个维度重构到另一个维度(ε = 1)时,最大可控带宽是全带宽。当每个维度的一半带宽可以重定向时,每个维度可以接收全带宽的最大75%。
除了边缘重构之外,还提出了一种多维作业映射策略,其中每个通信域在OCSBCube拓扑中尽可能多地映射到多个维度。具体来说,如果一个域需要pd个GPU,并且OCSBCube拓扑有n个维度,其中pd是n的整数倍且大于n,则该域映射到所有n个维度中的GPU,每个维度分配pd/n个GPU。与Google的TPUv4 Pod映射策略相比,后者将每个通信域分配给3D Torus内的单个维度,并将TPU注入带宽划分到这三个维度,所提出的映射策略能够同时在所有可用维度上传输单个域中的流量。这有效地使用全注入带宽并消除了域间重构的需要。