NVIDIA DGX Rubin 系统整合了 NVIDIA 在计算、网络和软件领域的最新突破,将推理 token 成本降至 NVIDIA Blackwell 平台的十分之一,可加速从推理和训练到长上下文推理的任意 AI 工作负载。

在 CES 上,NVIDIA 推出了 Rubin 平台,该平台由六款全新芯片组成,旨在打造一台超凡的 AI 超级计算机,专为加速代理式 AI、混合专家模型(MoE)以及长上下文推理而设计。
Rubin 平台通过先进的协同设计方法,将六款芯片——NVIDIA Vera CPU、Rubin GPU、NVLink 6 交换机、ConnectX-9 SuperNIC、BlueField-4 DPU 和 Spectrum-6 以太网交换机——进行了有机整合,从而加速训练过程并降低推理 token 生成成本。
不论是企业还是研究环境,DGX SuperPOD 都可作为部署基于 Rubin 系统的基础架构设计参考方案。
NVIDIA DGX 平台将从 NVIDIA 计算到网络再到软件的整个技术栈整合为一个统一协同的系统,消除了基础设施集成的负担,使团队能够专注于 AI 创新和业务成果。
NVIDIA 创始人兼首席执行官黄仁勋表示:“当前训练和推理的 AI 计算需求不断飙升,Rubin 的问世恰逢其时。”
基于 Rubin 的 DGX SuperPOD 部署将集成:
NVIDIA DGX Vera Rubin NVL72 或 DGX Rubin NVL8 系统NVIDIA BlueField-4 DPU,用于构建安全、软件定义的基础设施NVIDIA 推理上下文记忆存储平台,支持下一代推理工作负载NVIDIA ConnectX-9 SuperNICNVIDIA Quantum-X800 InfiniBand 与 NVIDIA Spectrum-X 以太网NVIDIA Mission Control,用于 AI 基础设施的自动化编排与运维DGX SuperPOD 长期以来一直是大型 AI 基础设施的蓝图。Rubin 平台的问世将成为新一代 AI 工厂的起点——这些系统旨在实现跨数千步推理,并以显著降低的成本交付智能,助力企业构建下一代尖端模型、多模态系统和代理式 AI 应用。
以上为摘要内容,点击链接阅读完整内容: