NVIDIA QUANTUM INFINIBAND PLATFORM

适用于各种规模云原生超级计算的超强性能

InfiniBand 网络解决方案

复杂的工作负载需要超快地处理高分辨率模拟、超大型数据集和高度并行的算法。随着这些计算需求不断增加,NVIDIA Quantum InfiniBand 作为可完全卸载的网络计算平台,能提供所需的巨大性能提升,在降低成本和复杂性的同时在高性能计算 (HPC)、AI 和超大规模云基础设施中带来超强性能。

InfiniBand 网卡

InfiniBand 网卡

InfiniBand 网卡 (HCA) 可提供超低延迟、超高吞吐量和创新的 NVIDIA 网络计算引擎,为当今的现代工作负载提供所需的加速能力、可扩展性和功能丰富的技术。

数据处理器 (DPU)

数据处理器 (DPU)

NVIDIA® BlueField® DPU 集强大的计算能力、高速网络和广泛的可编程性于一体,能为要求严苛的工作负载提供软件定义、硬件加速的解决方案。从加速 AI 计算到云原生超级计算,BlueField 重新定义了可能性。

InfiniBand 交换机

InfiniBand 交换机

InfiniBand 交换机系统提供超高的性能和端口密度。NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ 等创新功能和高级管理功能(例如自恢复网络功能、服务质量、增强的虚拟通道映射)以及 NVIDIA 网络计算加速引擎能提升工业、AI 和科学应用的性能

路由器和网关系统

路由器和网关系统

通过使用 InfiniBand 路由器、InfiniBand 长距离连接 (NVIDIA MetroX®-2) 和 InfiniBand to Ethernet 网关系统 (NVIDIA Skyway™),InfiniBand 系统能够提供超强可扩展性和子网隔离能力。如有需要,可以使用后者以高效且可扩展的方式将高性能、低延迟的 InfiniBand 数据中心连接到外部以太网基础设施(例如以太网存储)。

LinkX InfiniBand 线缆和收发器

LinkX InfiniBand 线缆和收发器

NVIDIA LinkX® 线缆和收发器旨在更大限度地提高 HPC 网络的性能,满足这类网络在 InfiniBand 元素之间建立高带宽、低延迟和高度可靠连接的要求

InfiniBand 的增强功能

网络计算

网络计算

NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ 可将集合通信运算从计算机卸载到交换机网络。这种创新方法可减少遍历网络的数据量,显著缩短 Message Passing Interface (MPI) 运算时间,并提高数据中心效率。

自恢复网络

自恢复网络

在 HPC 和 AI 中,集群依赖于高速、可靠的互连技术。具有自我修复网络功能的 NVIDIA InfiniBand 克服了链路故障,使网络恢复速度比任何其他基于软件的解决方案快 1,000 倍。自恢复网络功能利用了内置于新一代 InfiniBand 交换机中的智能功能。

服务质量

服务质量

InfiniBand 是具有经验证的服务质量功能(包括高级拥塞控制和动态路由)的高性能互连解决方案,能提供超高的网络效率。

网络拓扑

网络拓扑

InfiniBand 具有完善的集中管理功能,可以支持各种拓扑。最常见的拓扑包括 Fat Tree、Hypercubes、多维 Torus 和 Dragonfly+。经过优化的路由算法可在设计特定应用通信模式的拓扑时提供优化的性能。

帮助发挥出色性能的软件

MLNX_OFED

在各大高性能输入/输出 (IO) 供应商的协同开发和测试之下,OpenFabrics 联盟 (www.openfabrics.org) 的 OFED 在功能上获得了加强。NVIDIA MLNX_OFED 是经过 NVIDIA 测试和打包的 OFED 版本。

HPC-X

NVIDIA HPC-X® 是完整的 MPI 和 SHMEM/PGAS 软件套件。HPC-X 利用 InfiniBand 网络计算和加速引擎来优化研究和行业应用。

UFM

借助 NVIDIA UFM® 平台,数据中心管理员能够高效地对 InfiniBand 网络基础设施进行调配、监控、管理和主动故障排除。

MAGNUM IO

NVIDIA Magnum IO™ 利用网络 IO、网络计算、存储和 IO 管理,简化并加速多 GPU、多节点系统的数据传输、访问和管理。Magnum IO 支持 NVIDIA GPU 和 NVIDIA 网络硬件拓扑,以优化吞吐量和实现低延迟。

配置集群

Take Networking Courses

准备好购买了?

Resources

  • 视频
  • 解决方案简介