NVIDIA Quantum-2 InfiniBand 平台

超强性能适用于各种规模云原生超级计算

网络通信领域中超乎寻常的性能

NVIDIA Quantum-2 采用第七代 NVIDIA InfiniBand 架构,可为 AI 开发者和科学研究人员提供超强网络性能和丰富功能,帮助他们解决充满挑战性的问题。NVIDIA Quantum-2 通过软件定义网络、网络计算、性能隔离、高级加速引擎、远程直接内存访问 (RDMA) 以及高达 400 Gb/s 的超快的速度,为先进的超级计算数据中心提供助力。

数据吞吐量提高 2 倍

数据速度

MPI 性能提高 4 倍

提高性能

交换机系统容量提高 5 倍

降低 TCO

可扩展性提高 6.5 倍

百亿亿级 (Exascale) 计算就绪

AI 加速速度提高 32 倍

加速的深度学习

性能带来的影响

 

增强 HPC和 AI 超级计算机的算力及应用性能

加速网络计算

当前的高性能计算 (HPC)、AI 和超大规模基础设施需要更快速的互连、更智能的网络,从而以更高的速度和效率分析数据和运行复杂模拟计算。NVIDIA Quantum-2 携带预配置及可编程的计算引擎(如第三代 NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARPv3)™ 技术、Message Passing Interface (MPI) Tag Matching、MPI All-to-All 和可编程引擎)增强并扩展了网络计算能力,进而实现了优化的每节点成本和投资回报率。

 
Benefits of Performance Isolation

性能隔离

NVIDIA Quantum-2 InfiniBand 平台提供创新的主动监控和拥塞管理,以实现流量隔离,几乎完全消除性能抖动,确保可预测的性能,就像应用程序在专用系统上运行一样。

云原生超级计算

NVIDIA 云原生超级计算平台利用 NVIDIA® BlueField® 数据处理器 (DPU) 架构,以及高速、低延迟的 NVIDIA Quantum-2 InfiniBand 网络。该解决方案通过简单且安全的方式提供裸金属性能、用户管理和隔离、数据保护、按需高性能计算 (HPC) 和 AI 服务。

Data center with NVIDIA Quantum-2 InfiniBand architecture with SHARPv3 technology

快速的数据交付

主机网卡

NVIDIA ConnectX-7 InfiniBand 主机网卡 (HCA) 支持 PCIe 4.0 和 PCIe 5.0,有多种外形规格可供选择,单端口或双端口选项,可支持高达 400 Gb/s 的端口速度。

ConnectX-7 InfiniBand HCA 支持先进的网络计算功能,以及可编程引擎实现数据算法预处理,可以把应用程序控制路径也卸载到网络。

固定配置交换机

NVIDIA Quantum-2 固定配置交换机系列提供 64 个 400 Gb/s 端口或 128 个 200 Gb/s 端口,采用 32 个 OSFP 物理连接器。这款紧凑型 1U 交换机提供风冷和液冷两种版本,支持带管理或外部管理两种类型。

NVIDIA Quantum-2 固定配置交换机系列支持总计 51.2 TB/s 的双向吞吐量,每秒能够处理超过 665 亿个数据包。

模块化交换机

NVIDIA Quantum-2 模块化交换机系列提供以下端口配置:

> 2048 个 400 Gb/s 端口或 4096 个 200 Gb/s 端口

> 1024 个 400 Gb/s 端口或 2048 个 200 Gb/s 端口

> 512 个 400 Gb/s 端口或 1024 个 200 Gb/s 端口

这款大型模块化交换机可支持总计 1.64Pb/s 的双向吞吐量,是上一代 NVIDIA Quantum InfiniBand 模块化交换机的 5 倍。

收发器和线缆

NVIDIA Quantum-2 互连产品为构建适合的拓扑提供了出色的灵活性。产品包括各种收发器、MPO 光纤、有源铜缆 (ACC) 和无源铜缆 (DAC),支持一分二和一分四等选项。

并且提供良好的向后兼容性,很容易将最新的 400 Gb/s 集群与现有的基于 200 Gb/s 或 100 Gb/s 的基础设施进行连接。

世界领先的网络性能、可扩展性和效率

性能

> 每个端口的带宽高达 400Gb/s

> 一台交换机包含 64 个 NDR 400Gb/s 端口或 128 个 NDR200 200Gb/s 端口

> 一台模块化交换机包含 2048 个 NDR 端口或 4096 个 NDR200 端口

> 一台 NDR 交换机设备每秒可处理 665 亿个数据包(双向)

再创 InfiniBand 交换机新记录

> 每个端口的带宽比 HDR 提升 2 倍

> 交换机端口数比 HDR 增加 3 倍

> 每台交换机的 AI 加速能力比 HDR 提升 32 倍

> 四交换机层(三个跃点)DragonFly+ 网络中包含超过 100 万个 400Gb/s 节点,比 HDR 增加 6.5 倍

主要特性

> 完全的传输层卸载

> RDMA、GPUDirect® RDMA、GPUDirect Storage

> 可编程网络计算引擎

> MPI All-to-All 硬件加速

> MPI Tag Matching 硬件加速

> NVIDIA SHARPv3

> 高级自适应路由、拥塞控制和 QoS

> 网络链路故障自修复

NVIDIA Quantum-2 InfiniBand 平台