NVIDIA Rubin 平台

NVIDIA Vera Rubin 平台

塑造新一代 AI。

概览

引领代理式 AI 时代

NVIDIA Vera Rubin 平台专为代理式 AI 和推理时代而构建,用于应对大规模多步骤问题求解和长上下文工作流。通过消除通信和内存移动中的关键瓶颈,Vera Rubin 平台显著提升了推理能力,与 NVIDIA Blackwell 架构产品相比,实现了每瓦更多 Token 输出,并降低了每 Token 成本。

NVIDIA 发布 Rubin,开启新一代 AI 平台

NVIDIA Vera Rubin 平台发布。六款全新芯片,一台超凡 AI 超级计算机。

NVIDIA Vera Rubin 开启代理式 AI 前沿

NVIDIA Vera Rubin 平台七款全新芯片全面投产,扩展全球最大 AI 工厂的规模。

深入了解技术突破

Transformer 引擎

Rubin GPU 采用了全新的 Transformer 引擎 (TE),该引擎j具备硬件加速的自适应压缩功能,可在保持准确性的同时提升 NVFP4 性能,实现高达 50 petaFLOPS 的 NVFP4 推理。此 Transformer 引擎与 NVIDIA Blackwell 完全兼容,可确保无缝升级,因此之前优化的代码可轻松迁移到 Vera Rubin 平台。

第三代机密计算

NVIDIA 机密计算的第三代产品通过 NVIDIA Vera Rubin NVL72 将安全性扩展到整机架规模。这个平台在所有 36 个 NVIDIA Vera CPU、72 个 NVIDIA Rubin GPU 以及无缝连接它们的 NVIDIA NVLink™ 互连结构之间创建了一个统一、可信的执行环境。该平台可跨 CPU、GPU 和 NVLink 域保持数据安全。通过提供用于合规性加密验证服务,在实现超大规模扩展的同时确保无妥协的安全防护,为全球规模最大的专有模型、训练数据及推理工作负载提供全方位保护。

第六代 NVLink 和 NVLink 交换机

第六代 NVLink 实现了 NVIDIA 高速 GPU 互联结构的重大飞跃,将 72 颗 NVIDIA Rubin GPU 整合到一个性能域中。借助 Rubin GPU,NVIDIA Blackwell 的性能增长了一倍,可为每个 GPU 提供 3.6 TB/s 的带宽和 260 TB/s 的低延迟连接,以实现更快的通信。NVIDIA®(SHARP™)技术可将集合运算的网络拥塞降低多达 50%,结合该技术,这种新一代互连可在大规模环境下加速全球最大模型的训练和推理,且性能不打折扣。

第二代可靠性、可用性和可服务性 (RAS) 引擎

NVIDIA Vera Rubin平台凭借先进的可靠性功能提供机架级高韧性。NVIDIA Rubin GPU 配备专用的第二代 RAS 引擎,可实现主动维护和实时健康检查,且无需停机。NVIDIA Vera CPU则通过小型化压缩附加内存模组 (SOCAMM) LPDDR5X 和对 CPU 核心的系统内测试,增强了可维护性。 该机架引入了模块化、无电缆的托盘设计,相比 NVIDIA Blackwell 提升了组装和维护速度 18 倍。同时,它结合了智能弹性功能和软件定义的 NVLink 路由,确保持续运行并降低维护成本。

NVIDIA Vera CPU

NVIDIA Vera CPU 专为跨加速系统的数据移动和代理式推理而设计,提供全面的机密计算支持。它与 NVIDIA GPU 无缝配合,或独立运行在分析、云计算、编排、存储和高性能计算 (HPC) 工作负载上。Vera 集成了 88 个 NVIDIA 设计的核心、速度快达 1.2 TB/s 的 LPDDR5X 显存带宽和 NVIDIA 可扩展一致性网络,为数据和内存密集型工作负载提供可预测、高能效的性能,并完全兼容 Arm®。集成了 NVIDIA NVLink®-C2C 互连技术支持高带宽、一致性的 CPU–GPU 内存访问,从而最大限度提高系统利用率和效率。

探索 NVIDIA Vera Rubin 产品

NVIDIA Vera Rubin 计算平台

NVIDIA Vera Rubin NVL72 集成 72 个 NVIDIA Rubin GPU、36 个 NVIDIA Vera CPU、NVIDIA ConnectX®-9 SuperNIC™ 卡和 NVIDIA BlueField®-4 DPU,并且其位于数据中心的 NVIDIA LPX 机架旁边,以实现快速、低延迟的推理。 它可通过第六代 NVLink 和 NVLink 交换机在机架级平台上扩展智能,并借助 NVIDIA Quantum-X800 InfiniBand 和 NVIDIA Spectrum-X™ 以太网向外扩展,为大规模 AI 工业革命提供功耗支持。

NVIDIA Groq 3 LPX

NVIDIA Groq 3 LPX 是一款 AI 推理加速器,专为代理式 AI 的大规模上下文和低延迟需求而设计。 通过极致的协同设计,LPX 与 NVIDIA Rubin GPU 搭配使用,消除了在速度和规模之间权衡取舍的问题。 凭借每机架 128 GB SRAM、40 PB/s 显存带宽和 640 TB/s 扩展带宽,Groq 3 LPX 可增强 Vera Rubin 平台上的推理能力。

NVIDIA DGX Vera Rubin NVL72

NVIDIA DGX Vera Rubin NVL72 为企业提供了基于 NVIDIA Vera Rubin 架构的一站式、随时可部署型 AI 基础设施解决方案,专门设计用于大规模部署,以加速最复杂的 AI 模型。

NVIDIA HGX Rubin NVL8

NVIDIA HGX™ Rubin NVL8 将八个 NVIDIA Rubin GPU 与第六代高速 NVLink 互连产品集成,推动数据中心进入加速计算和生成式 AI 的新时代。NVIDIA HGX Rubin NVL8 可与 NVIDIA Vera CPU 或基于 x86 的 CPU 基板配对。

NVIDIA DGX Rubin NVL8

NVIDIA DGX Rubin NVL8 是一款液冷 AI 系统,由八颗 NVIDIA Rubin GPU 和第六代 NVLink 提供支持,专为加速各类 AI 工作负载的训练、推理和后训练而构建。

深入了解 NVIDIA Vera Rubin 平台

阅读技术博客,了解 NVIDIA Vera Rubin 如何将数据中心而非芯片作为计算单元,为高效、安全、可预测的大规模智能生产奠定新的基础。