面向现代数据中心的突破性 CPU。
NVIDIA Grace™ CPU 专为处理海量数据产生智能并实现卓越能效的新型数据中心而设计。这些数据中心可运行各种工作负载,包括 AI、数据分析、超大规模云应用以及高性能计算 (HPC)。与当今的前沿服务器相比,NVIDIA Grace 可提供每瓦两倍的性能、两倍的封装密度和超高内存带宽,以满足数据中心极为严苛的需求。
Grace CPU 集成 72 个高性能、高能效的 Arm® Neoverse™ V2 核心,并通过 NVIDIA 可扩展一致性结构 (SCF) 相连接,提供 3.2 TB/s 对分带宽 — 是传统 CPU 的两倍,可在提供超高性能的同时,保持与 Arm 生态系统完全兼容。Grace 是首个采用服务器级高速 LPDDR5X 显存的数据中心级 CPU,其宽内存子系统提供最高达 500 GB/秒的带宽,在成本相近的情况下,功耗仅为传统 DDR 内存的五分之一。
亮点
NVIDIA Grace 超级芯片 480 GB LPDDR5X,AMD EPYC 9654 768 GB DDR5。操作系统:Ubuntu 22.04 编译器:GCC 12.3(除非下方另有说明)。能效计算包含 CPU + 内存的实测功耗。图形分析:GAP 基准测试套件 BFS arXiv:1508.03619 [cs.DC],2015 年。数据分析:HiBench+K-means Spark(HiBench 7.1.1,Hadoop 3.3.3,Spark 3.3.0;Grace:NVHPC 24.5,x86:英特尔 2021.4)天气预测:ICON QUBICC 80 km 分辨率 NVHPC 24.5 (Grace) ICC 2021.4 (x86) 微服务:Google Protobufs(Commit 7cd0b6fbf1643943560d8a9fe553fd206190b27f | N 个并行实例)
特性
规格
NVIDIA Grace CPU C1 | NVIDIA Grace CPU Superchip | |
Configuration | 1x Grace CPU | 2x Grace CPU |
Core Count | 72 Arm Neoverse V2 Cores with 4x 128b SVE2 | 144 Arm Neoverse V2 Cores with 4x 128b SVE2 |
L1 cache | 64KB i-cache + 64KB d-cache per core | 64KB i-cache + 64KB d-cache per core |
L2 cache | 1MB per core | 1MB per core |
L3 cache | 114MB | 228MB |
LPDDR5X size | 120GB, 240GB and 480GB on-module memory options available | 240GB, 480GB and 960GB options available |
Memory bandwidth | Up to 384 GB/s for 480GB Up to 512 GB/s for 120GB, 240GB |
Up to 768 GB/s for 960GB Up to 1024 GB/s for 240GB, 480GB |
NVLink-C2C bandwidth | n/a | Up to 900 GB/s |
PCIe Links | Up to 4x PCIe Gen 5x16 with option to bifurcate | Up to 8x PCIe Gen 5x16 with option to bifurcate |