面向现代数据中心的突破性 CPU。
NVIDIA Grace™ CPU 专为处理海量数据产生智能并实现卓越能效的新型数据中心而设计。这些数据中心可运行各种工作负载,包括 AI、数据分析、超大规模云应用以及高性能计算 (HPC)。与当今的前沿服务器相比,NVIDIA Grace 可提供每瓦两倍的性能、两倍的封装密度和超高内存带宽,以满足数据中心极为严苛的需求。
Grace CPU 集成 72 个高性能、高能效的 Arm® Neoverse™ V2 核心,并通过 NVIDIA 可扩展一致性结构 (SCF) 相连接,提供 3.2 TB/s 对分带宽 — 是传统 CPU 的两倍,可在提供超高性能的同时,保持与 Arm 生态系统完全兼容。Grace 是首个采用服务器级高速 LPDDR5X 显存的数据中心级 CPU,其宽内存子系统提供最高达 500 GB/秒的带宽,在成本相近的情况下,功耗仅为传统 DDR 内存的五分之一。
NVIDIA Vera CPU 专为数据迁移和代理式推理而设计,能够与 NVIDIA GPU 无缝搭配用于 AI 系统,或独立运行以支持分析、云、编排和存储工作负载。
亮点
NVIDIA Grace 超级芯片 480 GB LPDDR5X,AMD EPYC 9654 768 GB DDR5。操作系统:Ubuntu 22.04 编译器:GCC 12.3 (除非下方另有说明)。能效计算包含 CPU + 内存的实测功耗。图形分析:GAP 基准测试套件 BFS arXiv:1508.03619 [cs.DC],2015 年。数据分析:HiBench+K-means Spark (HiBench 7.1.1,Hadoop 3.3.3,Spark 3.3.0;Grace:NVHPC 24.5,x86:英特尔 2021.4) 天气预测:ICON QUBICC 80 km 分辨率 NVHPC 24.5 (Grace) ICC 2021.4 (x86) 微服务:Google Protobufs (Commit 7cd0b6fbf1643943560d8a9fe553fd206190b27f | N 个并行实例)
特性
规格
| NVIDIA Grace CPU 超级芯片 | |
| 配置 | 2 个 Grace CPU |
| 核心数 | 144 个 ARM Neoverse V2 核心,4 个 128b SVE2 |
| L1 缓存 | 每个核心 64KB 指令缓存 (i-cache) + 64KB 数据缓存 (d-cache) |
| 二级缓存 | 每个核心 1MB |
| 三级缓存 | 228MB |
| LPDDR5x 内存容量 | 可选 240GB、480GB 和 960GB |
| 内存带宽 | 960GB 高达 768 GB/s 240GB 和 480GB 高达 1024 GB/s |
| NVLink-C2C 带宽 | 高达 900 GB/秒 |
| PCIe 链路 | 最多 8 个 PCIe Gen 5x16,可选分叉 |