与通用以太网 (OTS) 相比,将 AI 网络性能提升 1.6 倍。
使用 NVIDIA Spectrum-X™ 以太网网络平台训练和部署大规模 AI 任务。该平台由 NVIDIA Spectrum-X 以太网交换机和 NVIDIA Spectrum-X 以太网 SuperNIC™ 联合组成,用于数据中心的 AI 计算网络,为 AI 计算提供极致性能,使用 Spectrum-XGS 以太网实现多个 AI 数据中心连接扩展,支持创新的光电一体封装硅光技术,进一步提高能效和 AI 工作负载可靠性。
Spectrum-X 是一种革命性的解决方案,用于使用以太网构建多租户、超大规模 AI 云。助力客户显著提高 AI 云的性能和能效,并获得更高的可预测性和一致性,从而缩短上市时间并提高竞争优势。
Spectrum-X 以太网完全基于标准的以太网技术,支持云规模的开放以太网软件栈 (例如 SONiC),并融合了 NVIDIA 网络创新技术。
Spectrum-X 以太网为 NVIDIA 硬件和软件全栈系统实现优化和验证,为 AI 云创建了出色的以太网解决方案。NVIDIA DSX SimAir 平台将 Spectrum-X 以太网仿真与全栈 AI 工厂相集成,包括 NVIDIA 和生态系统合作伙伴的出色组件。
NVIDIA Spectrum-XGS 以太网专为跨多个不同的数据中心 (位于不同的建筑物或相距数百公里) 进行扩展而构建,使它们能够作为单个统一的 AI 超级工厂使用。Spectrum-XGS 以太网采用拓扑感知的拥塞控制算法、精确延迟管理和端到端遥测技术,可为跨数据中心通信提供高达 1.9 倍的 NCCL 性能。
Spectrum-X 以太网硅光技术通过将硅光器件与交换机 ASIC 封装在一起,进一步降低功耗、提高可靠性并提升 AI 生产力。与传统基于可插拔收发器的网络相比,Spectrum-X 以太网硅光技术可将网络能效提高 3.5 倍,网络可靠性提高 10 倍,AI 应用持续运行时间提高 5 倍。
多平面使以太网能够使用两层扁平拓扑将扩展规模从数千个 GPU 提升到数十万个 GPU。通过将每个 GPU 的 SuperNIC 拆分到两个或多个独立的网络平面,克服了单平面规模限制,提高了性能和可靠性。采用 Spectrum-X 以太网两层组网支持扩展至 13 万个 GPU,比单平面网络组网方案提升了 64 倍。
Spectrum-X 以太网与 NVIDIA MGX™ ETL 机架级架构完美集成,为超高密度计算机架提供高性能以太网网络,将 MGX 液冷方案和可靠性创新扩展到更广泛的计算选项。基于铜介质的节能电缆架(Cable Cartridge)将液冷式 Spectrum-X 以太网交换机托盘与机架内的多达 256 个 GPU 进行连接,而前面板光纤连接则可扩展到更大的 GPU 域。
NVIDIA Spectrum-X 以太网交换机专为加速超大规模生成式 AI 网络而打造。Spectrum-X 以太网交换机为 AI 工厂提供高效的带宽和性能隔离,助力基础设施扩展至数十万个 GPU,实现全球超大型 AI 模型的训练和部署。
NVIDIA Spectrum-X 以太网 SuperNIC 是新型网络加速器,专为增强超大规模 AI 工作负载而打造。NVIDIA SuperNIC 专为网络密集型大规模并行计算而设计,为 GPU 服务器之间通信提供高带宽 RDMA over Converged Ethernet (RoCE) 网络连接,优化峰值 AI 工作负载效率。