杭州金秋九月,桂香满城,丹桂飘香中迎来科技创新的热潮。2025 阿里云栖大会在杭州如约启幕,以“云智一体,碳硅共生”为主题,掀起一场思想与技术的巅峰对话。作为大会的重要组成部分,AI Infra 网络技术论坛与展览现场人潮涌动、盛况空前,吸引了来自全球的技术专家、企业领袖、开发者及科研机构代表齐聚一堂,共同探讨网络技术创新趋势,见证数字化转型的澎湃浪潮。
本届大会设立“AI Infra 可预期网络”专题论坛,聚焦 AI infra 的全栈优化,分别从架构演进洞见、生态伙伴创新、模型框架联合优化三个角度带来了一次全新的 AI infra 网络进化之旅。
论坛从阿里云 AI infra 可预期网络的未来规划与实践开场,阿里云网络研发负责人蔡德忠先生回顾过去展望未来,洞悉 AI 行业发展趋势并提出 AI infra 网络的挑战和架构规划,发布阿里云新一代 HPN8.0 十万卡级别的训推一体架构和 UPN512 光互联 Scale up 架构,指引未来 Scale out 和 Scale up 架构的发展方向。本次云栖大会阿里云发布 128 超节点成为焦点,面向未来 Scale up 域更进一步扩展所遇到的挑战,UPN512 网络架构将利用先进的 LPO/NPO 技术降低光互联成本,同时实现规模扩展,并解耦对高密系统的依赖(详见 UPN512 技术架构白皮书[1])。阿里云资深技术专家席永青详细介绍了 HPN8.0 和 UPN512 架构背后的设计思考和实践,并发布阿里云 UPN512 技术架构白皮书,阿里云高性能网络研发负责人付斌章介绍了高性能网络协议和通信库方面的创新实践,以及网络生态合作方面的进展。
论坛第二部分分别由来自博通公司的高级副总裁 Ram 和英伟达公司高级副总裁 Marc 带来了头部网络芯片公司的技术展望和激进的 AI 产品规划,彰显以太网持续蓬勃的强大生态。
论坛第三部分分别由阿里云资深技术专家张彭城、阿里云高级技术专家李庆旭、月之暗面 kimi 工程师黄唯啸和 SGLang 社区 Core team member 梁杰鑫带来了模型框架和通信库层面结合的优化实践,探讨了 AI 框架优化发展趋势,给网络全栈优化注入新的创新动能。
最后,阿里云资深技术专家苏远超主持了圆桌论坛,与五位演讲嘉宾一起探讨了AI infra 网络发展的关键问题,嘉宾从不同角度带来了解决问题、突破 AI infra 网络创新的理念,为现场观众带来了激烈而精彩的技术思想碰撞。
与论坛相呼应,“AI Infra 可预期网络”主题展览成为本届云栖大会的亮点展区之一。展区今年推出众多产品展示,涵盖从数据中心到广域网,以及高速率 800G 和 1.6T 光模块。数据中心网络升级到 800G/1.6T HPN 8.0 架构,广域网升级到新一代 400G eCore 架构,阿里云基础设施网络正在经历一次从 DCN 到 DCI 的全面迭代升级,以满足 AI 和云计算带来的指数级流量增长。

同时在 CPO 和 NPO 技术选择上,阿里云网络团队选择 NPO 作为技术切入点,推出一款基于 4 颗 25.6T 国产芯片互联组成的 102.4T 设备。
现阶段,AI Infra 可预期网络正成为支撑大模型训练与推理的重要支柱。它不仅是连接算力的“高速通道”,更是确保任务稳定、效率最优的“神经中枢”。通过网络架构迭代、软硬件结合、系统生态与强化学习、分布式推理等关键技术的融合创新和协同进化,可预期网络实现了从“尽力而为”到“使命必达”的根本跃迁,展现出前所未有的技术先进性与产业价值。阿里云在该领域的持续突破,标志着中国在 AI 基础设施底层技术上已走在全球前列。在这里,网络不再沉默,而是主动服务 AI,真正成为驱动智能时代的“隐形引擎”。
相关链接:
[1]UPN512 技术架构白皮书
https://developer.aliyun.com/ebook/8478/

