NVIDIA Ampere 助力实现专业
可视化效果

性能提升

NVIDIA® RTX 平台已在专业视觉计算领域中掀起变革。NVIDIA Ampere 架构建立在 RTX 的强大功能之上,可显著提高渲染、图形、AI 和计算工作负载的性能。NVIDIA Ampere 以追求完美为设计目标,并且包含先进的创新技术,使 RTX 在处理专业工作负载时的表现更上一层楼。

NVIDIA Ampere 架构创新

第二代
RT Cores

第二代 RT Core 的计算吞吐量是上一代的 2 倍*,并能同时运行光线追踪和着色或降噪功能,从而大幅加快工作负载的运行速度,例如电影内容的逼真渲染和产品设计的虚拟原型创建。这项技术还可加速渲染具有光线追踪效果的动态模糊画面,从而更快获得视觉准确性更高的结果。

第三代
Tensor Cores

新的 Tensor Float 32 (TF32) 精度提供的训练吞吐量达到上一代的 5 倍,而且无需更改代码即可加速 AI 和数据科学模型的训练。从硬件上支持结构化稀疏使推理吞吐量提升一倍。 Tensor Core 还通过 DLSS、AI 降噪等功能将 AI 引入到图形处理中,并增强了特定应用程序的编辑功能。

CUDA
核心

与上一代相比,NVIDIA Ampere 架构的 CUDA® 核心可将单精度浮点 (FP32) 运算处理速度提升一倍,并将能效提升 2 倍。这显著改善了 3D 模型开发等图形工作流程的性能,另外还为计算机辅助工程 (CAE) 的桌面模拟等工作负载提供了强大算力。

PCI Express
第 4.0 代

基于 NVIDIA Ampere 架构的 GPU 支持 PCI Express 第 4.0 代(即 PCIe 第 4.0 代),该规范提供的带宽是 PCIe 第 3.0 代的 2 倍。这提高了从 CPU 内存传输数据的速度,可更好地执行 AI 和数据科学等数据密集型任务。更快的 PCIe 性能还能加速 GPU 直接显存访问 (DMA) 传输,从而能让支持视频的设备通过 GPUDirect® 更快速地传输视频数据,以及利用 GPUDirect Storage 加快输入/输出 (I/O) 速度。

第三代
NVLink

第三代 NVIDIA NVLink® 技术允许用户将 2 个 GPU 连接起来,以分享 GPU 性能和显存。借助高达 112 千兆字节/秒 (GB/s) 的双向带宽和高达 96 GB 的组合显存,专业人员可以应对大型的渲染、AI、虚拟现实和视觉计算工作负载。新的 NVLink 连接器还具有更低矮的外形,可在更多型号的机箱中实现 NVLink 功能。

产品架构资料

查看基于 NVIDIA Ampere 架构的 RTX 最新产品。