NDR 400G InfiniBand 架构

赋能百亿亿级 AI 时代

InfiniBand 网络解决方案

NVIDIA® InfiniBand 互连技术集高速、超低延迟的可扩展解决方案与网络计算技术于一体,可在网络上执行各种数据算法,从而开创“以数据为中心”的数据中心时代。InfiniBand 技术能让超级计算机、人工智能 (AI) 和云数据中心以不同规模运行,同时降低运营成本和基础设施复杂性。

InfiniBand Adapters - Accelerating AI, Data Science, and HPC Workloads

InfiniBand 网卡 – 加速 AI、数据科学和 HPC 等应用

InfiniBand 网卡 (HCA) 以其更快的速度和创新的硬件加速技术,实现了业务的超低延迟,并在先进的应用加速引擎的加持下,有效满足高性能计算、人工智能、机器学习、云、存储、数据库和嵌入式应用的需求,同时降低每项操作的成本和提高总体投资回报率。

Programmable DPU

可编程 DPU

NVIDIA BlueField® DPU (数据处理单元) 具有先进的软件可编程性,可为数据中心提供优越的性能、安全性和各种功能,实现创新的网络互连和 I/O 加速。

InfiniBand Switches - Unrivaled Performance and Economics at Scale

InfiniBand 交换机 - 出色的性能和规模经济效益

InfiniBand 交换机可提供超高的性能和端口密度。创新的SHARP(Scalable Hierarchical Aggregation and Reduction Protocol)网络计算技术、SHIELD(Self-Healing Interconnect Enhancement for Intelligent Datacenters )网络自愈技术、先进的的QoS(服务质量控制)、拥塞控制和动态路由等技术提供了超高的总体系统性能、可扩展性和网络利用率。

Routers & Gateway Systems to Bridge InfiniBand to Ethernet

InfiniBand路由器和从InfiniBand到以太网的网关

通过使用 InfiniBand 路由器、InfiniBand 长距离连接 (NVIDIA MetroX®-2)产品 和 InfiniBand到以太网的网关产品 (NVIDIA Skyway),InfiniBand 平台能够提供杰出的可扩展性和子网隔离能力。如有需要,可以使用Skyway以高效、可扩展的方式将高性能、低延时的 InfiniBand 数据中心连接到外部的以太网基础设施(例如以太网存储)。

LinkX InfiniBand Cables and Transceivers

LinkX InfiniBand 线缆和收发器

NVIDIA LinkX® 线缆和收发器旨在更大限度地发挥高性能计算网络的性能,满足各个 InfiniBand 设备之间对于高带宽、低延迟和高可靠性的要求。

InfiniBand 的增强功能

In-Network Computing

网络计算

NVIDIA SHARP (Scalable Hierarchical Aggregation and Reduction Protocol) 技术可将集合通信运算从 CPU 卸载到网络中的交换机上。这种创新的解决方案减少了遍历网络的数据量,显著缩短了 MPI 通信的时间。

Self Healing Network

网络自愈技术

在 HPC 中,集群对于网络的性能和可靠性的追求是无极限的。NVIDIA SHIELD 技术能克服链路故障问题,使网络故障恢复速度比其他基于软件的解决方案快 5000 倍。SHIELD 利用了新一代 InfiniBand 交换机内置的智能计算功能。

Quality of Service

QoS(服务质量控制)

InfiniBand 是业界领先的、QoS机制得到了大规模应用和认可的高性能互连网络,其高级拥塞控制和动态路由等功能,能大幅提升网络通信效率。

Network Topologies

网络拓扑

InfiniBand 具备完整的集中管理功能,可以支持各种网络拓扑。最常见的拓扑包括胖树、Hypercube、多维 Torus 和 DragonFly+ 等。可以根据特定的应用通信模型来设计不同的拓扑方案,优化路由算法,实现最优的应用性能。

帮助发挥出色性能的软件

MLNX_OFED

在各大高性能 I/O设备供应商的协同开发和测试之下,OpenFabrics 联盟 (www.openfabrics.org) 的 OFED 功能强大。NVIDIA MLNX_OFED 是经过 NVIDIA 认证和由 NVIDIA 提供的 OFED 版本。

HPC-X

NVIDIA HPC-X® ScalableHPC 工具包是完整的 MPI 和 SHMEM/PGAS 软件套件。利用 HPC-X,可快速部署应用程序并得到更高的应用程序性能,远离成本高昂且操作复杂的第三方工具和库许可问题。

UFM

NVIDIA UFM® (Unified Fabric Management) 平台将增强的实时网络遥测与 AI 驱动的网络智能和分析相结合,以实现更高的网络资源利用率和竞争优势,同时降低运营成本。

MAGNUM IO

Magnum IO 利用网络 IO、网络计算、存储和 IO 管理以简化并加速多 GPU、多节点系统的数据传输、访问和管理。Magnum IO 支持 NVIDIA GPU 和 NVIDIA 网络硬件拓扑,以优化吞吐量和实现低延迟。

配置工具

在线课程

准备购买