NVIDIA Ampere 架构

全球效能最强弹性数据中心的核心。

现代数据中心内的人工智能与高效能运算核心

科学家、研究人员和工程师致力于透过人工智能和高效能运算 (HPC) 解决全球最重要的科学、产业与巨量资料难题。同时,企业也正在努力驾驭人工智能的强大力量,从而能够从本机或云端的庞大数据集中获取新洞察。专为弹性运算时代打造的 NVIDIA Ampere 架构将引领新一波大跃进,为各种规模需求提供无与伦比的加速效能。

突破性创新

NVIDIA Ampere 架构以 540 亿个晶体管打造,是有史以来最大的 7 纳米 (nm) 芯片,包含六项关键的突破性创新。

第三代 Tensor 核心

NVIDIA Tensor 核心技术最先运用在 NVIDIA Volta™ 架构上,不只大幅加速人工智能,也将训练时间从数周降至数小时,同时显著提升推论速度。NVIDIA Ampere 架构以这些创新技术为基础,采用全新精度标准 Tensor Float 32 (TF32) 与 64 位浮点 (FP64),以加速并简化人工智能应用,同时将 Tensor 核心效能拓展至高效能运算。

TF32 与 FP32 运作方式相同,无需更改任何程序代码即可将人工智能速度提升至最高 20 倍。透过 NVIDIA 自动混合精度,研究人员只要多加几行程序代码,就可以利用自动混合精度和 FP16 将效能提升 2 倍。而 NVIDIA Ampere 架构 Tensor 核心 GPU 中的 Tensor 核心透过支持 bfloat16、INT8 与 INT4,能为人工智能训练和推论创造极致多元的加速器。A100A30 GPU 不只将强大的 Tensor 核心导入高效能运算,也支持完整矩阵运算、通过 IEEE 认证,并使用 FP64 精度。

第三代 Tensor 核心
多实例 GPU (MIG)

多实例 GPU (MIG)

每个人工智能与高效能运算应用都能受益于加速,但并非所有应用都需要使用 GPU 的完整效能。多实例 GPU (MIG) 是 A100A30 GPU 支持的功能,可让工作负载共享 GPU。MIG 让每个 GPU 能分隔成多个 GPU 实例,各自在硬件中完全独立且受保护,且具备个别的高带宽内存、快取和运算核心。现在不论大小,开发人员可为所有应用提供突破性加速,并获得服务质量保障。IT 管理人员可为最佳利用率提供规模适中的 GPU 加速,并将横跨实体与虚拟环境的访问权限扩展给每个使用者和应用。

结构化稀疏

结构化稀疏

现代人工智能网络相当庞大且越来越大,有数百万、甚至数十亿个参数。精准预测与推论不需要用到所有参数,而有些参数可以转换为零,以确保模型变「稀疏」的同时不会牺牲准确性。Tensor 核心最高可以将稀疏模型的效能提高 2 倍。将模型稀疏化对于人工智能推论有益,同时也能改善模型训练效能。

第二代 RT 核心

NVIDIA A40A10 GPU 中,NVIDIA Ampere 架构的第二代 RT 核心可大幅提升电影作品的拟真渲染、建筑设计评估,以及产品设计的虚拟原型制作等工作负载的速度。RT 核心还能加速光线追踪于动态模糊的渲染效果,以更快的速度获得更高的视觉准确度,还能在执行着色或噪声消除功能的同时,执行光线追踪。

第二代 RT 核心
更聪明、快速的内存

更聪明、快速的内存

A100 为数据中心提供大量运算效能。为充分运用运算引擎,A100 具备领先同级产品的每秒 2 TB (TB/秒) 内存带宽,比前一代产品高出 2 倍多。此外,A100 的芯片内存也显著增加,具备 40 MB 的 2 级快取,为上一代产品的 7 倍,可将运算效能最大化。

边缘聚合加速

NVIDIA 聚合加速器 结合了 NVIDIA Ampere 架构和 NVIDIA BlueField®-2 数据处理器 (DPU),带来了前所未有的运算和网络加速能力,能够处理数据中心和边缘端产生的庞大数据量。BlueField-2 结合了 NVIDIA ConnectX®-6 Dx 的强大功能,以及可程控的 Arm 核心与硬件卸除功能,可适用于软件定义的储存空间、网络、安全性和管理工作负载。有了 NVIDIA 聚合加速器,客户就能以最高的安全性和效能执行数据密集型的边缘端和数据中心工作负载。

边缘聚合加速
密度优化的设计

密度优化的设计

NVIDIA A16 GPU 采用四 GPU 主板设计,专为用户密度优化,并结合了 NVIDIA 虚拟 PC (vPC) 软件,让用户无论身在何处都可以使用绘图运算丰富的虚拟 PC。与仅使用 CPU 的 VDI 相比,NVIDIA A16 可提供更高的帧速率和较低的终端用户延迟,因此应用程序反应能更灵敏,并带来与原生 PC 无异的使用者体验。

探索 NVIDIA Ampere 架构

探索架构的尖端技术及其 GPU 的完整列表。