NDR 400Gb/s InfiniBand 架构

适用于各种规模云原生超级计算的超强性能

网络通信领域中超乎寻常的性能

搭载 NDR 400Gb/s 技术的第七代 NVIDIA InfiniBand 架构可为 AI 开发者和科研人员提供超快网络性能,以帮助他们解决极具挑战的问题。NDR InfiniBand 具有软件定义网络、远程直接内存访问 (RDMA)、网络计算、高级加速引擎以及超快的速度和供应机制,能为全球大型超级计算数据中心提供助力。

nvidia-networking-ndr-technology-numbers-1cn-d

增强 HPC和 AI 超级计算机的算力及应用性能

加速网络计算

当下的高性能计算 (HPC)、AI 和超大规模基础架构要求更快速的互连、更智能的网络,从而以更高的速度和效率分析数据和运行复杂模拟计算。NVIDIA InfiniBand 利用多种可预配置及可编程的计算引擎(如第三代 NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARPv3)™、Message Passing Interface (MPI) Tag Matching、MPI All-to-All 和可编程引擎)增强并扩展了其网络计算能力,同时实现了优化的单节点成本和投资回报率。

通过 NVIDIA Mellanox InfiniBand 架构加速网络内计算
数据中心拥有采用 SHARPv3 技术的 NVIDIA Mellanox NDR InfiniBand 架构

无限可扩展性

NDR InfiniBand采用SHARPv3技术,通过网络为大型数据的聚合创造了几乎无限的可扩展性,支持多达64个并行流,是上一代HDR InfiniBand产品AI加速能力的32倍。MPI All-to-All 和 MPI Tag Matching 硬件引擎,加上其它功能,如增强的拥塞控制、动态路由和网络链路故障自恢复等功能,所有这些都对增强HPC和 AI 集群的性能至关重要,令其能够达到更高的性能。

可以达到光一样的速度

主机通道适配器

NVIDIA ConnectX-7 NDR 400Gb/s InfiniBand 主机通道适配器 (HCA) 可提供超高的网络性能,用于处理极具挑战性的工作负载。

基于 PCIe 4.0 和 PCIe 5.0 的 NDR InfiniBand HCA 支持多种外形规格,可以提供速度达 400Gb/s 的单网络端口或双网络端口。

NDR InfiniBand HCA 包含高级网络计算功能,并支持 MPI All-to-All 和 MPI Tag Matching 硬件引擎。为提升服务质量 (QoS),其他网络改进还包括自适应路由和拥塞控制。HCA 还包含其他可编程引擎,可实现数据算法预处理,并可将应用控制路径卸载至网络。这将提供更高的性能和可扩展性,并加强计算与通信之间的重叠。

固定配置交换机

NDR InfiniBand 固定配置交换机系列提供 32 个 OSFP 物理接口,可支持 64 个 NDR 端口或 128 个 NDR200 端口。这款紧凑型 1U 交换机提供风冷和液冷两种版本,支持从内部或外部进行管理。

NDR InfiniBand 固定配置交换机系列提供总计 51.2 Tb/s 双向吞吐量,每秒能够处理超过 665 亿个数据包。作为出色的机架式 InfiniBand 解决方案,这款交换机可支持多种网络拓扑,包括 Fat Tree、DragonFly+、多维 Torus、Hypercube 等,灵活度极高。

模块化交换机

NDR InfiniBand 模块化交换机系列提供以下端口配置:

> 2048 个 NDR 端口 (400Gb/s) 或 4096 个 NDR200 端口 (200Gb/s)

> 1,024 个 NDR 端口 (400Gb/s) 或 2,048 个 NDR200 端口 (200Gb/s)

> 512 个 NDR 端口 (400Gb/s) 或 1,024 个 NDR200 端口 (200Gb/s)

这款大型模块化交换机可支持总计 1.64Pb/s 的双向吞吐量,是上一代 HDR InfiniBand 模块化交换机的 5 倍。

收发器和线缆

NDR InfiniBand 连接产品包括各种收发器、MPO 光纤接头、有源铜缆 (ACC) 以及一分二和一分四形式的无源铜缆 (DAC)。这为构建具有极佳性能的不同拓扑提供了极大的灵活性。

世界领先的网络性能、可扩展性和效率

性能

> 每个端口的带宽高达 400Gb/s

> 一台交换机包含 64 个 NDR 400Gb/s 端口或 128 个 NDR200 200Gb/s 端口

> 一台模块化交换机包含 2048 个 NDR 端口或 4096 个 NDR200 端口

> 一台 NDR 交换机设备每秒可处理 665 亿个数据包(双向)

再创 InfiniBand 交换机新记录

> 每个端口的带宽比 HDR 提升 2 倍

> 交换机端口数比 HDR 增加 3 倍

> 每台交换机的 AI 加速能力比 HDR 提升 32 倍

> 四交换机层(三个跃点)DragonFly+ 网络中包含超过 100 万个 400Gb/s 节点,比 HDR 增加 6.5 倍

主要特性

> 完全的传输层卸载

> RDMA、GPUDirect® RDMA、GPUDirect Storage

> 可编程网络计算引擎

> MPI All-to-All 硬件加速

> MPI Tag Matching 硬件加速

> NVIDIA SHARPv3

> 高级自适应路由、拥塞控制和 QoS

> 网络链路故障自修复

要了解 NDR 详情,请阅读完整的架构简介。