大数跨境

上新!英伟达发布新GPU,专为长上下文推理而设计

上新!英伟达发布新GPU,专为长上下文推理而设计 七喜之声
2025-09-11
1
导读:在AI大模型处理能力竞赛中,长上下文推理已成为关键突破点。
1动态海报[1].gif

新GPU.jpg

AI大模型处理能力竞赛中,长上下文推理已成为关键突破点。99日,全球人工智能算力芯片龙头英伟达又放出AI计算大招,推出专为大规模上下文推理和视频生成应用打造的Rubin CPX GPU,其将于2026年底上市。

横线.png


近日,全球人工智能算力芯片龙头英伟达正式发布全新GPU——NVIDIA Rubin CPX,这是首款专为长上下文工作负载设计的新型专用GPU,用于翻倍提升当前AI推理运算的工作效率,尤其是编程、视频生成等需要超长上下文窗口的应用。


英伟达透露,搭载Rubin CPX的Rubin机架在处理大上下文窗口时的性能时,能够比当前旗舰机架GB300 NVL72高出最多6.5倍。




01
为何需要全新的专用GPU?


传统的GPU在处理AI推理时存在着严重的资源错配问题。


英伟达CEO黄仁勋指出,推理过程包括的上下文处理阶段与生成输出阶段,两者对基础设施的需求不同,而当前的GPU均针对生成阶段设计,导致上下文处理时高性能资源的利用率较低。例如,解码10万行代码可能需要用到5-10分钟,而视频的生成预处理因逐帧处理增加延迟等,这些痛点都制约了AI在实际复杂场景中的应用。


Rubin CPX将作为英伟达的专用GPU,用于上下文和预填充计算,从而显著提升海量上下文AI应用的性能


微信图片_2025-09-10_161715_067.jpg

02
技术创新


Rubin CPX在架构与技术规格上实现了突破。


其采用单片设计的NVFP4架构,在专用精度下提供30千万亿次浮点运算能力,配备128GB GDDR7内存,专门针对“数百万tokens”级别的长上下文性能进行优化,以此解决长上下文处理的内存瓶颈,避免分批处理导致的效率损失。与英伟达GB300 NVL72系统相比,其注意力加速3倍。


据悉,完整的Vera Rubin NVL144 CPX平台在单个机架中集成144个Rubin CPX GPU、144个Rubin GPU和36个Vera CPU,单个机架中提供8 exaFLOPs算力、100TB高速内存及1.7PB/s的内存带宽,较GB300 NVL72系统性能提升7.5倍。


144CPX 机架.png


03
核心应用场景


在实际应用中,新的GPU重塑了AI生产力工具——



软件开发领域

它将AI编程助手升级为能理解“大规模软件项目”的智能协作伙伴


视频处理方面

通过编解码与推理功能,为长视频内容生成提供记忆能力和连贯性,突破传统GPU在小时级内容分析上的算力限制


04
影响


英伟达CEO黄仁勋将Rubin CPX的意义比作RTX对图形和物理AI领域的革新,正如其所言,Rubin CPX是AI计算前沿的又一次飞跃。


据其测算,新芯片的投资回报率达到30-50倍,部署价值1亿美元的新芯片将可产生50亿美元的收益。该测算强调了英伟达对AI基础设施商业价值的量化努力。


在开发最复杂的人工智能系统的竞赛中,Rubin CPX的推出标志着AI推理进入了百万token上下文时代,为企业处理超长文档、复杂代码库和长视频内容提供了核心算力支撑,这也进一步巩固了英伟达在AI基础设施领域的领先地位。


图片来源网络,侵删






在企业数字化转型加速、算力需求爆发的当下,七喜电脑亦与时俱进,依托卓越的技术实力和丰富的行业经验,积极推进一系列服务器产品制造与压测服务,助力企业突破算力瓶颈,实现自主可控。此外,七喜电脑也拥有资源丰富的配件供应链,包括显卡(可支持英伟达主流显卡)、网卡及IB卡等,为客户提供优质的产品和服务。



动态海报2[1].gif
公众号尾图.png
动态海报3[1].gif

【声明】内容源于网络
0
0
七喜之声
广州七喜电脑有限公司为七喜集团旗下IT产业核心公司, 是AIoT边缘算力底座及定制化提供商,已有26年的品牌历史。
内容 102
粉丝 0
七喜之声 广州七喜电脑有限公司为七喜集团旗下IT产业核心公司, 是AIoT边缘算力底座及定制化提供商,已有26年的品牌历史。
总阅读0
粉丝0
内容102