NVIDIA Quantum-2 InfiniBand 平台

超强性能适用于各种规模云原生超级计算

网络通信领域中超乎寻常的性能

NVIDIA Quantum-2 采用第七代 NVIDIA InfiniBand 架构,可为 AI 开发者和科学研究人员提供超强网络性能和丰富功能,帮助他们解决充满挑战性的问题。NVIDIA Quantum-2 通过软件定义网络、网络计算、性能隔离、高级加速引擎、远程直接内存访问 (RDMA) 以及高达 400 Gb/s 的超快的速度,为先进的超级计算数据中心提供助力。

2X Data Throughput

Data Speed

4X MPI Performance

Improved Performance

5X Switch System Capacity

Improved TCO

6.5X Higher Scalability

Exascale Ready

32X More AI Acceleration

Accelerated Deep Learning

性能带来的影响

增强 HPC和 AI 超级计算机的算力及应用性能

加速网络计算

当前的高性能计算 (HPC)、AI 和超大规模基础设施需要更快速的互连、更智能的网络,从而以更高的速度和效率分析数据和运行复杂模拟计算。NVIDIA Quantum-2 携带预配置及可编程的计算引擎(如第三代 NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARPv3)™ 技术、Message Passing Interface (MPI) Tag Matching、MPI All-to-All 和可编程引擎)增强并扩展了网络计算能力,进而实现了优化的每节点成本和投资回报率。

 
Benefits of Performance Isolation

性能隔离

NVIDIA Quantum-2 InfiniBand 平台提供创新的主动监控和拥塞管理,以实现流量隔离,几乎完全消除性能抖动,确保可预测的性能,就像应用程序在专用系统上运行一样。

云原生超级计算

NVIDIA 云原生超级计算平台利用 NVIDIA® BlueField® 数据处理器 (DPU) 架构,以及高速、低延迟的 NVIDIA Quantum-2 InfiniBand 网络。该解决方案通过简单且安全的方式提供裸金属性能、用户管理和隔离、数据保护、按需高性能计算 (HPC) 和 AI 服务。

Data center with NVIDIA Quantum-2 InfiniBand architecture with SHARPv3 technology

快速的数据交付

主机网卡

NVIDIA ConnectX-7 InfiniBand 主机网卡 (HCA) 支持 PCIe 4.0 和 PCIe 5.0,有多种外形规格可供选择,单端口或双端口选项,可支持高达 400 Gb/s 的端口速度。

ConnectX-7 InfiniBand HCA 支持先进的网络计算功能,以及可编程引擎实现数据算法预处理,可以把应用程序控制路径也卸载到网络。

固定配置交换机

NVIDIA Quantum-2 固定配置交换机系列提供 64 个 400 Gb/s 端口或 128 个 200 Gb/s 端口,采用 32 个 OSFP 物理连接器。这款紧凑型 1U 交换机提供风冷和液冷两种版本,支持带管理或外部管理两种类型。

NVIDIA Quantum-2 固定配置交换机系列支持总计 51.2 TB/s 的双向吞吐量,每秒能够处理超过 665 亿个数据包。

模块化交换机

NVIDIA Quantum-2 模块化交换机系列提供以下端口配置:

> 2048 个 400 Gb/s 端口或 4096 个 200 Gb/s 端口

> 1024 个 400 Gb/s 端口或 2048 个 200 Gb/s 端口

> 512 个 400 Gb/s 端口或 1024 个 200 Gb/s 端口

这款大型模块化交换机可支持总计 1.64Pb/s 的双向吞吐量,是上一代 NVIDIA Quantum InfiniBand 模块化交换机的 5 倍。

收发器和线缆

NVIDIA Quantum-2 互连产品为构建适合的拓扑提供了出色的灵活性。产品包括各种收发器、MPO 光纤、有源铜缆 (ACC) 和无源铜缆 (DAC),支持一分二和一分四等选项。

并且提供良好的向后兼容性,很容易将最新的 400 Gb/s 集群与现有的基于 200 Gb/s 或 100 Gb/s 的基础设施进行连接。

世界领先的网络性能、可扩展性和效率

性能

> 每个端口的带宽高达 400Gb/s

> 一台交换机包含 64 个 NDR 400Gb/s 端口或 128 个 NDR200 200Gb/s 端口

> 一台模块化交换机包含 2048 个 NDR 端口或 4096 个 NDR200 端口

> 一台 NDR 交换机设备每秒可处理 665 亿个数据包(双向)

再创 InfiniBand 交换机新记录

> 每个端口的带宽比 HDR 提升 2 倍

> 交换机端口数比 HDR 增加 3 倍

> 每台交换机的 AI 加速能力比 HDR 提升 32 倍

> 四交换机层(三个跃点)DragonFly+ 网络中包含超过 100 万个 400Gb/s 节点,比 HDR 增加 6.5 倍

主要特性

> 完全的传输层卸载

> RDMA、GPUDirect® RDMA、GPUDirect Storage

> 可编程网络计算引擎

> MPI All-to-All 硬件加速

> MPI Tag Matching 硬件加速

> NVIDIA SHARPv3

> 高级自适应路由、拥塞控制和 QoS

> 网络链路故障自修复

NVIDIA Quantum-2 InfiniBand 平台