在今年 CES 2026 上,英伟达推出了下一代的 Rubin GPU 架构,其中比较特别的是同步介绍了英伟达第二代 CPU 产品 Vera,虽然是为 GPU 定制的 CPU 芯片,但英伟达也许会成为一家 CPU 产商。
首先回顾下英伟达 CPU 相关情况,在 Hopper GPU 发布的时候,英伟达基于 Arm 的Neoverse V2 公版架构推出了 Grace CPU,当时的目标是提升 CPU 与 GPU 之间的传输速度(NVLink-C2C)。
而到了 Rubin 平台上,英伟达更进一步,采用 Arm 指令集,推出了自己的 Arm 微架构 Olympus,对应的产品就是 Vera CPU。
Vera CPU 的最大一个特点就是支持空间多线程,也就是说每个 CPU 核心有两个超线程。有一说一,现在服务器 CPU 很少采用多线程了,那这个空间多线程什么意思呢?
普通的多线程是两个线程共享同一个物理执行单元,本质上还是通过时间片来切换使用资源,也叫时间多线程。
而空间多线程可能是真正意义上的多线程,当然目标不是为了执行性能,而是加速数据传输,这和GPU深度绑定的。
此外 Vera CPU 第一次支持 FP8 精度,这是第二个特点。
第三个特点还是提供更高的内存带宽,每秒能达到 1.2TB,是上一代的2.4 倍。
第四个特点是 NVLink-C2C 传输速率能达到 1.8 TB。
其实仔细一琢磨,就能看出英伟达定制的 CPU 都是为了加速数据吞吐率,最大限度的利用 GPU 算力,避免数据传输(不管是CPU读取内存,还是CPU与GPU之间传输)成为瓶颈。
下图可以了解两代 CPU 之间的区别:
最后的一点感受,像 DGX Spark 搭配的就是 Grace CPU,也能运行 Ubuntu 操作系统,是否能证明英伟达的 Arm CPU 和数据中心CPU、消费者CPU、Linux在兼容性上已经做的不错了呢?
还有和联发科合作开发的基于 Windows 系统的 N1X CPU,目前也没有太多的进展。
此外英伟达又投资了Intel,如何将 x86 CPU 整合到GPU产品中?
目前 AMD 也在大力发展 GPU,最关键的优势就是AMD也有CPU,而英伟达没有。
未来英伟达会如何发展其 CPU 呢?此外下一代 GPU 架构不是 Rubin GPU,而叫 Vera Rubin GPU,包含了什么深意呢。
相关文章:

