NVIDIA NVLink Fusion

为半定制 AI 基础设施应用经过业界验证的 AI 纵向扩展性能与机架级体系架构。

概览

卓越的纵向扩展性能

NVLink Fusion 是一个机架级 AI 基础设施平台,助力超大规模数据中心和自定义 ASIC 设计用户将自定义的 CPU 或 XPU 与业界领先的 NVLink 纵向扩展互连技术及 OCP MGX 机架级服务器架构进行集成。借助 NVIDIA 经过实践检验的 AI 技术栈以及经过行业验证的机架级设计和生态系统,可加快上市速度、降低开发成本和部署风险,并以更高的投资回报率实现更优异的性能。

NVLink Fusion 模块化技术组合包括 NVIDIA GPU、NVIDIA Vera™ CPU、NVLink 纵向扩展网络、光电一体封装 (CPO) 交换机、NVIDIA ConnectX® SuperNIC、BlueField® DPU 和 Mission Control 软件。这个丰富全面的生态系统包括 ASIC 设计者、CPU 和 IP 提供商、OEM/ODM 以及组件供应商,涵盖快速部署定制 AI 芯片所需的一切。

AWS AI 基础设施将与 NVIDIA NVLink Fusion 集成,加速 Trainium4 部署

了解 AWS 如何使用 NVLink Fusion 加速 Trainium4 部署。

借助 NVIDIA NVLink Fusion 实现半定制计算平台与机架级架构的集成

了解 NVIDIA NVLink Fusion 如何帮助超大规模数据中心用户构建半定制 AI 基础设施,将其 ASIC 或 CPU 与 NVIDIA GPU 相集成,同时实现统一可扩展硬件基础设施的标准化。

借助 NVLink Fusion,高性能 AI 工厂可以快速扩展,并受益于构成 NVIDIA 机架级架构的所有组件。

优势

NVLink Fusion 的优势

卓越的纵向扩展性能

要释放 AI 工厂的全部潜力,所有加速器之间必须实现快速无缝通信。NVIDIA NVLink 6 能够连接 72 个 XPU,实现每个 XPU 3.6 TB/s 的 all-to-all 带宽,显著提升 AI 性能与投资回报率。

降低开发成本

成熟的 NVLink Fusion 供应商生态系统提供基于 OCP MGX 架构实现完整机架级部署所需的所有组件,从机架、机箱、电源到冷却系统,消除新机架设计相关的开发成本和部署风险。

加速上市时间

借助 NVIDIA 经过实战检验的技术栈以及由 ASIC 设计者、CPU 和 IP 提供商以及 OEM/ODM 组成的生态系统,超大规模数据中心企业可以加快产品上市,更快实现盈利。

统一的架构

由于超大规模企业已部署了完整的 NVIDIA 机架解决方案,NVLink Fusion 技术可在标准化通用机架设计的同时支持异构芯片产品,从而加速 AI 工厂部署并简化管理。

平台

NVIDIA NVLink Fusion 平台

NVIDIA NVLink

NVIDIA NVLink 6 和 NVLink Switch 芯片在 72 个加速器的 NVLink 域 (NVL72) 中实现 260 TB/s 的带宽,并支持 NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ FP8 技术实现 4 倍带宽效率。

NVIDIA NVLink-C2C

NVIDIA NVLink-C2C 将行业领先的 NVLink 技术扩展到芯片之间的直连。助力 NVIDIA 合作伙伴通过 chiplets 创造新型集成产品,实现 NVIDIA GPU 或 CPU 与客户定制芯片的高带宽一致性连接。

采用企业

NVLink Fusion 生态系统

借助 NVLink Fusion 扩展 AI 推理性能

了解 NVIDIA NVLink Fusion 如何满足复杂 AI 模型日益增长的需求。