首款专为大规模上下文 AI 设计的 CUDA GPU，英伟达 Rubin CPX 发布

近日，英伟达正式发布了一款专为大规模上下文处理设计的新型 GPU —— Rubin CPX。这款产品将主要应用于对计算性能要求极高的任务，例如大规模编码、视频生成等 AI 工作负载。Rubin CPX 的核心设计理念在于将 AI 提示理解与响应生成两个任务进行分离，从而提升整体处理效率，为用户提供更高效的计算体验。

Rubin CPX 将作为英伟达全新 Vera Rubin 平台的重要组成部分，该平台整合了 Vera CPU 与 Rubin GPU。据官方介绍，基于 Rubin CPX 的全机架系统 Vera Rubin NVL144 CPX 可提供高达 8 exaflops 的 AI 计算能力，展现了其在高性能计算领域的强大实力。

在硬件规格方面，独立版的 Rubin CPX GPU 配备了 128GB GDDR7 显存，支持 3 倍的 attention 能力，并采用英伟达自研的 4-bit NVFP4 精度技术，提供高达 30 petaflops 的计算性能。CEO 黄仁勋在发布会上将 Rubin CPX 与 RTX 系列进行了类比，强调其将成为 AI 领域的又一革命性产品，具备在同一时间处理数百万知识符号模型的能力。

此外，黄仁勋还从投资回报角度对 Rubin CPX 进行了解读。他指出，客户在部署该硬件方面投入的 1 亿美元，预计可带来高达 50 亿美元的收益，充分体现了其商业价值与技术优势。英伟达也承诺将为 Rubin CPX 提供完整的软件生态系统支持，包括其多模态 AI 模型系列 —— Nemotron。

Nemotron 模型涵盖了多个版本，从小型设备端的 Nano，到适用于单 GPU 环境的 Super，再到面向大型数据中心的 Ultra，满足不同应用场景的需求。这些模型将助力企业构建具备自主处理复杂任务能力的 AI 代理系统，进一步推动 AI 技术在各行业的落地。

英伟达表示，Rubin CPX 预计将在 2026 年底正式推出，届时将为 AI 计算领域带来新的突破与变革。

英伟达,Rubin CPX,GPU,人工智能,大规模上下文处理

本文来源：