大数跨境
0
0

AWS:就看不上你们网络差生文具多

AWS:就看不上你们网络差生文具多 云深知网络
2025-12-09
0
导读:AWS和博通:司心隔肚皮
上周SemiAnalysis
对AWS Trainium做深度剖析
结合AWS大会 春风得意的自是英伟达
要论失意一是丢掉芯片定制大单的Marvell
无往不利已经拿下七家顶级客户的博通也是之一

Re:invent大会最亮眼的是
AWS自研第三代推出Trainium3
文中提到Marvell在Trn二代执行不利
所以三代换了台系公司执刀没提是否有博通


无论是
当前Trn支持的NeuronLink
还是超节点中大量使用的Retimer
AWS都不依赖霸主博通还扶持了Astera Lab
并且成功将这个名不见经传的小公司送上资本市场

SemiAnalysis:幸运的是,亚马逊与Astera Labs建立了战略合作伙伴关系。读者无疑会联想到我们在TPU文章中强调的OpenAI/Anthropic/英伟达的合作模式,而得益于直接投资,事实证明AWS采购得越多,节省也越多


如果AWS达到了其对Astera Labs的PCIe交换机和Retimer的采购量承诺,它将获得与这些产品采购挂钩的ALAB股票认股权证。这些认股权证会随着AWS达到采购里程碑而逐步归属生效。由于行权价仅为20.34美元,任何高于此水平的市场价格都会为AWS创造即时价值。这一结构实质上让AWS在采购组件时获得了一种基于股权的“返利”。在下面的情景中,截至9月25日已归属的股票认股权证相当于获得了约23% 的有效折扣。 

到了第四代Trainium4
从Scale Up协议就知道还没博通的份儿
浓眉大眼的家伙即使投靠NVLink也不吊SUE

从Scale Up过渡到Out
有Nitro在谁也别想抢网卡生意
即使Nitro升级太慢也没有选择用CX
所以博通的Thor 800不800 WHO CARE
博通与英伟达龙争虎斗,我有一计可破曹营

Scale Out交换机
AWS倒是依赖博通和M两家
但是对不起只有差生文具多才靠100T
AWS还在大规模使用12.8T/25.6T/51.2T
(灵魂发问:AWS买不到102.4T的交换芯片吗)

SemiAnalysis:如果我们固守传统方法,采用与GPU网卡相匹配的逻辑端口大小(多数情况下为400G),那么仅使用12.8T交换机构建的网络规模将受到极大的限制。对于一个完全由12.8T交换机构建的两层网络,最多只能连接512个GPU。然而,如果我们转而采用100G逻辑端口,一个两层网络的规模可达8,192个GPU,而一个三层网络则可扩展至524,288个GPU,这与当今最大的多机房集群规模相匹配。


但是,为什么要用12.8T交换机来构建网络呢?实际上,AWS对此并无特别偏好。其信条是最小化总体拥有成本,并围绕这一核心目标灵活制定采购决策。打个比方,对AWS而言,不管黑猫白猫,抓到老鼠就是好猫。因此,只要能够实现最低的总体拥有成本,AWS会选择任何交换机方案,无论是12.8T、25.6T还是51.2T交换机,或是400G DR4、800G DR8光模块。 

AWS对高Radix
而不是端口绝对带宽的追求
和之前提到的Sindhu说法是一致的
终于有大佬站出来揭穿 AI 网络的新装?

今年的Re:invent 25
没有太多Ultracluster3.0信息
回顾一下去年Ultracluster2.0的情况

2024年年底AWS推出Trainium 2服务器



与之配套的集群网络

被称之为Ultracluster 2.0



内部被称之为10p10u

10PB 的网络容量延迟不到10微秒



2023年推出的
Ultracluster 1.0开始关注HPC/ML



同期开始规划的UC 2.0
在算力提升的背景下配套吞吐能力


但是重心放在

规模扩大后定制新的

路由协议和效率更高的管理平面



视觉效果
网络架构简化很多

跟着Semianalysis炒谷
AWS网络互连还有一个炸子鸡
对Credo和对ALAB的操作如出一辙

SemiAnalysis:在每颗Trainium3芯片配备200G带宽的版本中,每张400G Nitro-v6网卡将为两颗Trainium3芯片提供支持。AWS采用双ToR交换机设计,其中一张Nitro-v6网卡通过两个200G链路,分别连接到位于计算托盘上方的两台ToR交换机。在连接Trainium计算托盘时,会使用一根带Gearbox的400G Y型有源铜缆(AEC),将网卡端的56G SerDes通道转换为ToR交换机端的112G SerDes通道。而对于CPU托盘,则使用直连式AEC或有源直连铜缆(DAC) 将其连接到同一对ToR交换机。


对亚马逊而言幸运的是,由于从Credo公司获得的股票返利,他们在AEC上得到了比PCIe交换机和Retimer更优惠的交易。Credo的股票返利方案与AWS和ALAB的交易结构相同,但实际返利金额要大得多。这得益于该协议中AWS获得了数量远超以往的认股权证,以及此后Credo股价的大幅上涨。这意味着,亚马逊从Credo获得的认股权证价值,已经超过了为使其归属而需要完成的采购金额。Credo实际上是在付钱请亚马逊使用AEC!。 

AWS与博通司心
隔肚皮的原因也好理解
一方是xPU定制领域的霸主
武器精尖弹药充足所以要保证Margin
国内几家所谓的大厂最近都在头疼货期吧


另一方零售起家精打细算
云业务本质是对成本的极致控制
店大欺客那咱就多扶持几个自家的兄弟
甚至NPF认为兼容UALink的NeuronLink-v5
将是A自研而不是ALAB、Marvell或其它家的肉
(灵魂发问:AWS和AMD为何不做以太网交换芯片)

相关文档交流移步汗牛充栋知识星球。

相关阅读:

P4可编程SDN交换机

P4教程 P4应用 P4论文

Tofino1 | Tifino 2 |国产P4交换机

【声明】内容源于网络
0
0
云深知网络
“可能是中国最好的OPEN网络公众号” “嗯,必须是的”
内容 1315
粉丝 0
云深知网络 “可能是中国最好的OPEN网络公众号” “嗯,必须是的”
总阅读1.2k
粉丝0
内容1.3k