作者 | 允毅、木子
今年的 CES 备受关注,黄仁勋、苏姿丰、陈力武等科技领袖齐聚一堂。与往年不同的是,讨论焦点已从显卡、算力和制程转向 AI 的未来发展方向。
在 AMD 的专场演讲中,CEO 苏姿丰提出一项大胆预测:
“未来五年内,全球将有 50 亿人每天使用 AI,超过世界人口的一半。”
这一增长速度远超互联网早期阶段。自 ChatGPT 于 2022 年底发布以来,AI 活跃用户已从百万级迅速突破至十亿级。
值得一提的是,斯坦福大学教授、“AI 教母”李飞飞也受邀出席,与苏姿丰共同探讨空间智能与世界模型——她深耕逾 20 年的研究领域。
Helios 机架级平台:重新定义数据中心算力
AMD 推出全新 Helios 机架级平台,作为其面向 YottaFLOPS 级 AI 计算的下一代基础设施,成为本次发布会的核心亮点。
所谓 YottaFLOPS 级 AI,即系统具备每秒 10²⁴ 次浮点运算能力,可实现对全球气候、人类基因组等复杂系统的快速模拟与优化,远超当前主流大模型的处理能力。
Helios 基于开放 OCP 机架标准打造,并与 Meta 联合开发,强调模块化设计与大规模集群扩展能力。单台机架集成 72 块 AI GPU,提供高达 2.9 ExaFLOPS 的 FP4 推理算力,并配备 31TB HBM4 高带宽内存。
该平台通过高速互联与统一调度软件栈,将多颗 GPU 协同为一个整体算力池,而非孤立设备拼接,显著提升资源利用率。
其核心算力来自新一代 Instinct MI455 GPU,采用 2nm 与 3nm 混合工艺及 3D 小芯片封装技术,晶体管数量超 3000 亿,相较 MI300 系列提升约 70%,训练与推理综合性能最高可达 10 倍提升。
MI455 重点突破“内存墙”瓶颈,搭载新一代 HBM4 内存,同时在计算托盘层面深度集成 EPYC CPU 与 Pensando 网络芯片,构建 CPU-GPU-网络一体化平台架构。
苏姿丰形容 Helios 为“双倍宽度的重型货架”,重量接近 7000 磅,超过两辆小型轿车总重,凸显其工程规模。
未来路线图:四年性能提升千倍
针对持续扩大的 AI 推理需求,苏姿丰透露,AMD 正在研发下一代 MI500 系列加速器,计划于 2027 年全面转向 2nm 工艺。
按照规划,从 MI300 到 MI500 的四年周期内,AI 计算性能目标提升 1000 倍,远超摩尔定律增速,被苏姿丰称为“公司历史上最大幅度的性能跃迁”。
这一升级旨在支撑万亿参数级大模型的训练与实时推理,成为下一代超大规模 AI 系统的关键基础。
Ryzen AI Max 400:推动 AI 向终端迁移
除云端布局外,AMD 加速推进 AI 本地化落地,重点发力 AIPC(AI PC)市场。
Ryzen AI Max 400 系列(代号 Strix Halo)是其核心产品,定位面向 AI 开发者与高端创作者,致力于让个人设备具备本地运行大模型的能力。
该处理器基于 Zen 5 架构与 RDNA 3.5 核显,集成 XDNA 2 NPU,提供最高 60 TOPS 的专用 AI 算力,并支持高达 128GB 统一内存架构,确保数据高效流通。
现场演示显示,搭载 Ryzen AI 的笔记本可在完全离线状态下流畅运行 700 亿参数医疗大模型,意味着行业用户无需上传敏感数据即可完成本地推理分析。
此外,AMD 发布 Ryzen AI Halo 参考平台,号称“全球最小 AI 开发系统”,可在离线环境下运行高达 2000 亿参数的模型,适用于移动开发与部署场景。
与李飞飞共话空间智能:AI 进入三维理解时代
李飞飞在演讲中指出,AI 正从语言智能迈向具备空间理解与行动能力的新阶段。
她认为,真正的智能不仅在于“说”和“看”,更在于感知、推理与物理世界的交互,而空间智能正是连接三者的核心能力。
其创办的 World Labs 正在训练新一代世界模型(World Model),目标并非还原二维图像,而是直接学习 3D/4D 结构、物体空间关系、深度尺度与物理一致性。
- 仅凭少量照片甚至单张图像,即可补全遮挡区域,推断背后结构
- 生成几何一致、可导航的持久性三维空间
- 将传统需数月完成的 3D 场景建模缩短至几分钟
应用场景涵盖内容创作、机器人训练、自动驾驶仿真以及建筑设计等领域。
她特别强调,世界模型需具备实时响应与连续编辑能力,这对算力提出极高要求:高内存容量、大规模并行计算与低延迟推理。
目前,World Labs 的模型已运行于 AMD MI325X GPU 与 ROCm 软件栈之上,短期内实现推理性能提升超 4 倍。随着 MI450 等新平台推出,更大规模世界模型的实时运行将成为可能。
其他新品发布
消费级显卡:Radeon RX 9070 系列
AMD 推出 Radeon RX 9070 与 RX 9070 XT,均基于 RDNA 4 架构,支持 FSR 4 等 AI 图像增强技术,进入“AI 加速 + 实时渲染”新时代。
RX 9070 XT 搭载 64 个计算单元,在 4K 最高画质下表现强劲,平均帧率较 RX 7900 GRE 提升 42%;RX 9070 虽规格略低,但仍实现 21% 的性能领先,适合 1440p 至 4K 游戏场景。
AI 专用 CPU:EPYC Venice
EPYC Venice 是 AMD 为 AI 数据中心时代打造的下一代服务器 CPU,采用 2nm 工艺,最多集成 256 个 Zen 6 核心。
其核心使命不是直接参与 AI 计算,而是高效调度数据流,避免 GPU 因等待数据而空转。内存与 GPU 带宽均实现翻倍,并配套 800G 以太网与 Pensando 网络芯片,支撑万级机架横向扩展。
在 AMD 架构中,Venice 扮演 AI 机架系统的“中枢处理器”,保障整个集群稳定高效运行。

