新一代网络技术高效赋能高性能、可扩展且安全的十亿瓦级 AI 工厂。
概览
AI 工厂如今已扩展至数万颗 GPU 的规模,且很快将达到数百万颗,这些 GPU 整合为一个统一的分布式计算引擎运行。为了让加速器始终保持满负荷运行,AI 工作负载对网络提出了确定性时延、无损吞吐、稳定的迭代时间等要求,且不仅在单个数据中心内扩展,还将跨多个数据中心扩展。
NVIDIA 网络提供了实现这一目标所需的全栈网络解决方案,包括用于纵向扩展的 NVIDIA NVLink™、用于横向扩展的 NVIDIA Quantum InfiniBand 和 Spectrum-X™ 以太网、用于跨数据中心扩展的 Spectrum-XGS、用于基础设施服务的 NVIDIA® BlueField® DPU 和 DOCA™,以及下一代硅光平台,为全球领先的 AI 工厂提供动力支撑。
NVIDIA 将网络构建为集成式 AI 平台的一部分,将 GPU、SuperNIC™、DPU、交换机、光学器件和软件整合起来实现极致协同设计,实现大规模扩展且可预测的性能。
精选