前情摘要:UEC 要完犊子吧?Tesla 携传输协议 TTPoE 加入超以太网联盟
介绍

在 HotChips 2024 上,Tesla 宣布开源 Tesla Transport Protocol over Ethernet(TTPoE),GitHub 仓库地址:https://github.com/teslamotors/ttpoe
特斯拉还宣布加入超级以太网联盟 (UEC) 以共享此协议,并致力于为 AI/ML/数据中心标准化一种新的高速/低延迟架构(无论是 TTPoE 或其他方式)- 希望有一个非专有、低成本、分布式拥塞控制、标准 EthernetII 帧和非集中式互连协议,便于商用并加速技术进步。
在 TTPoE 中,就像 TCP 一样,丢弃数据包和回放是可接受的默认行为,但可以保证完全传输。
TTPoE 的初始部署是针对 Tesla Dojo v1 项目,其中协议完全在硬件中执行,并已部署到一个非常大的multi-ExaFlops (fp16) 超级计算机上,该超级计算机有超过数万个并发端点。此协议不需要 CPU 或 OS 以任何方式参与链接和处理。
如果你认为TTPoE是个复杂又聪明的玩意儿,那你错了。该协议的设计基于基本原理 - 简单传输和切中要害。以太网传输本质上只是为了将数据从 A 点移动到 B 点,并且应该受到的是物理介质的限制,而不是软件执行时间。对超大型机器(就像互联网一样)进行集中式拥塞管理是徒劳无功的,每个端点都应该具有弹性和自我管理能力。
Eric Quinnell -- Sept 13, 2024

对 TTPoE协议 感兴趣的同学,点赞和在看后,在公众号后台回复“tooyum149”可以获取下载地址。
相关阅读:

