上新！英伟达发布新GPU，专为长上下文推理而设计- 大数跨境

首页

上新！英伟达发布新GPU，专为长上下文推理而设计

七喜之声

2025-09-11

导读：在AI大模型处理能力竞赛中，长上下文推理已成为关键突破点。

在AI大模型处理能力竞赛中，长上下文推理已成为关键突破点。9月9日，全球人工智能算力芯片龙头英伟达又放出AI计算大招，推出专为大规模上下文推理和视频生成应用打造的Rubin CPX GPU，其将于2026年底上市。

横线.png

近日，全球人工智能算力芯片龙头英伟达正式发布全新GPU——NVIDIA Rubin CPX，这是首款专为长上下文工作负载设计的新型专用GPU，用于翻倍提升当前AI推理运算的工作效率，尤其是编程、视频生成等需要超长上下文窗口的应用。

英伟达透露，搭载Rubin CPX的Rubin机架在处理大上下文窗口时的性能时，能够比当前旗舰机架GB300 NVL72高出最多6.5倍。

为何需要全新的专用GPU？

传统的GPU在处理AI推理时存在着严重的资源错配问题。

英伟达CEO黄仁勋指出，推理过程包括的上下文处理阶段与生成输出阶段，两者对基础设施的需求不同，而当前的GPU均针对生成阶段设计，导致上下文处理时高性能资源的利用率较低。例如，解码10万行代码可能需要用到5-10分钟，而视频的生成预处理因逐帧处理增加延迟等，这些痛点都制约了AI在实际复杂场景中的应用。

而Rubin CPX将作为英伟达的专用GPU，用于上下文和预填充计算，从而显著提升海量上下文AI应用的性能。

技术创新

Rubin CPX在架构与技术规格上实现了突破。

其采用单片设计的NVFP4架构，在专用精度下提供30千万亿次浮点运算能力，配备128GB GDDR7内存，专门针对“数百万tokens”级别的长上下文性能进行优化，以此解决长上下文处理的内存瓶颈，避免分批处理导致的效率损失。与英伟达GB300 NVL72系统相比，其注意力加速3倍。

据悉，完整的Vera Rubin NVL144 CPX平台在单个机架中集成144个Rubin CPX GPU、144个Rubin GPU和36个Vera CPU，单个机架中提供8 exaFLOPs算力、100TB高速内存及1.7PB/s的内存带宽，较GB300 NVL72系统性能提升7.5倍。

144CPX 机架.png

核心应用场景

在实际应用中，新的GPU重塑了AI生产力工具——

软件开发领域

它将AI编程助手升级为能理解“大规模软件项目”的智能协作伙伴

视频处理方面

通过编解码与推理功能，为长视频内容生成提供记忆能力和连贯性，突破传统GPU在小时级内容分析上的算力限制

影响

英伟达CEO黄仁勋将Rubin CPX的意义比作RTX对图形和物理AI领域的革新，正如其所言，Rubin CPX是AI计算前沿的又一次飞跃。

据其测算，新芯片的投资回报率达到30-50倍，部署价值1亿美元的新芯片将可产生50亿美元的收益。该测算强调了英伟达对AI基础设施商业价值的量化努力。

在开发最复杂的人工智能系统的竞赛中，Rubin CPX的推出标志着AI推理进入了百万token上下文时代，为企业处理超长文档、复杂代码库和长视频内容提供了核心算力支撑，这也进一步巩固了英伟达在AI基础设施领域的领先地位。

图片来源网络，侵删

在企业数字化转型加速、算力需求爆发的当下，七喜电脑亦与时俱进，依托卓越的技术实力和丰富的行业经验，积极推进一系列服务器产品制造与压测服务，助力企业突破算力瓶颈，实现自主可控。此外，七喜电脑也拥有资源丰富的配件供应链，包括显卡（可支持英伟达主流显卡）、网卡及IB卡等，为客户提供优质的产品和服务。

【声明】内容源于网络

七喜之声

广州七喜电脑有限公司为七喜集团旗下IT产业核心公司，是AIoT边缘算力底座及定制化提供商，已有26年的品牌历史。

内容 102

粉丝 0

七喜之声广州七喜电脑有限公司为七喜集团旗下IT产业核心公司，是AIoT边缘算力底座及定制化提供商，已有26年的品牌历史。

总阅读0

粉丝0

内容102