SDN时代的旧神遇到了AI时代的新大陆
Mansour愿景
在我职业生涯的多数时间里,我都专注于数据中心网络领域。我可以肯定地说,我们正经历一个自互联网兴起以来前所未有的关键时代变革。这一变革主要由三大关键因素驱动:
(1)爆发式增长。根据Dell'Oro集团的数据中心交换机报告,过去十年间,以太网数据中心交换机市场的年增长率一直维持在中等至较高个位数水平,但如今正以每年20%至30%的速度增长,预计到2030年市场规模将达到约600亿美元。其中,应用于AI横向扩展Scale Up网络的以太网数据中心交换机预计将以超过100%的年复合增长率攀升,从2023年的不足10亿美元增至2029年的近300亿美元-占据总市场的半壁江山。当市场如此迅猛扩张时,现有厂商难以跟上步伐;市场空白随之出现,客户需求无法得到充分满足。
(2)需求的剧烈变化。过去十年间,云网络的核心是成本优化。云服务商将网络视为普通商品。如果某个网络部件发生故障,软件层会直接绕过问题继续运行。而AI的到来改变了这一状况。尽管网络仅占AI集群物料清单(BOM)成本的15%,但集群性能的任意低效或欠佳表现都会对GPU利用率产生显著影响,进而影响训练或推理时间。云网络追求成本优化,而AI网络必须实现性能优化。这是网络需求的根本性转变,需要全新的解决方案。
(3)技术进步。过去几年,我们在精细遥测访问、AI网卡以及AI优化网络堆栈(如NCCL和RCCL)等领域取得了显著进展,实现了以往难以想象的可见度水平。同时,智能代理AI的兴起正在重塑软件架构的演进方式。这些进步为应对AI网络不断变化的需求提供了独特的创新途径。
为了参与这一市场、全力推动创新并提供变革性解决方案,我们决定创立一家公司,并将其命名为Aria Networks。我们找到了理想的合作伙伴:Arista的工程负责人Subhachandra Chandra(他亦曾在Ghost公司从事多年自动驾驶软件研发)以及Sutter Hill Ventures。
时光飞逝,一年过去。我们已顺利起步,组建了一支在硬件、软件、分布式系统、AI和云领域经验丰富的专业团队。尽管仍处于发展初期,我们决定趁OCP大会逐步揭示我们的愿景和产品轮廓。
Aria的标语是“会思考的网络”(Networks that Think)。这一直是行业的奋斗目标,也是下一个前沿领域。如今,借助精细遥测、AI和云技术的综合进步,这一目标已成为可能。这是符合逻辑的演进-从基于意图的网络等确定性自动化技术,迈向概率性、直觉式智能。这种智能能够以毫秒级分辨率对微秒级粒度的遥测数据作出响应,相较当前网络中常见的秒级或分钟级分辨率,实现了100至10,000倍的提升(具体因应用场景而异)。我们的应用场景是AI集群,服务各类规模的NeoCloud客户,从几十个GPU到超过10万个GPU。
我们目前正处于试验阶段,并准备与愿意在未来一年内与我们合作的客户接洽。我们将提供AI优化的硬件和Aria集群软件-该解决方案可使您的网络投资回报率提升10倍以上。
Networks that Think的基石:为何选择与Aria Networks合作
有以下几点令人信服的理由:
坚实的硬件基础:我们提供可靠的Tomahawk 5交换机和全面的连接选项-这些是当前AI部署(包括前端和后端)的主力设备。
稳定可靠、功能丰富的SONiC系统:我们提供功能齐全、稳定可靠的开源SONiC操作系统版本。SONiC是当今数据中心网络的标准操作系统,客户正日益将其API标准化。您不仅能获得SONiC、开源优势、标准API和现代软件架构,还能享有您所期望的所有功能以及由我们一流自动化测试框架保障的卓越可靠性。
关键的第一层级优势:您将通过Aria集群软件,率先受益于我们无与伦比的精细分辨率(比竞争对手高100-10,000倍)和大规模遥测平台。该软件整合了交换机内置软件、我们的本地Aria服务器和Aria云服务。
白手套尊享服务White Glove Treatment:作为我们商业服务的一部分,我们将派遣现场部署工程师(FDE),他们将成为您网络团队的延伸。结合Aria软件堆栈,我们将为您提供从A到Z的全方位网络需求支持。
总而言之,与Aria合作意味着投资于一个无与伦比的基础:顶尖的硬件、稳定的SONiC操作系统,以及立即可用的、无与伦比的高分辨率遥测技术优势-所有这些都通过Aria的尊享服务交付,使您在"会思考的网络"时代成为领跑者。
相关阅读:
P4可编程SDN交换机
P4教程 P4应用 P4论文
Tofino1 | Tifino 2 |Tofino 3
基于可编程交换机的网络仿真平台

