实时光线追踪生态系统提速:适用于 GeForce RTX 和 GeForce GTX 的 DXR

由 Andrew Burnes 发表于 2019年3月18日 | GeForce GTX GPUs Featured Stories GDC 2019 NVIDIA RTX Ray Tracing

从引擎更新到惊艳刺激的游戏,再到开发人员工具,NVIDIA 及其合作伙伴不断在  GDC 2019 上发布一系列光线追踪公告,旨在推动生态系统围绕这项激动人心的新技术继续前进

几十年来,NVIDIA 一直有一个梦想,就是要实现视频游戏的实时光线追踪。但这需要投入数百万小时的研发工作,需要关注从 GPU 硬件和软件到更新版 API 和游戏引擎,再到开发工具和降噪器的方方面面。2018 年,所有的努力随着 GeForce RTX GPU  的推出开花结果,GeForce RTX GPU 是全球首款带有专用 RT 核心光线追踪硬件的消费级显卡,能够以高保真和高分辨率实现逼真的光线追踪效果。

从那时起,我们的软件和开发团队就一直在努力,支持我们开展光线追踪技术优化工作,进行新的软件改进,并帮助开发人员进一步提高游戏中的光线追踪性能。正是这些努力让我们得以大幅提高 GeForce RTX GPU 的光线追踪性能。预计 4 月,我们将能够通过 Game Ready 驱动程序更新在 GeForce GTX 1060 6GB 及更高版本显卡上启用 DirectX Raytracing (DXR)。

对支持 RT 的 GPU 来说,更大的存量用户有助于推动开发人员采用光线追踪技术,为 GeForce RTX 和 GeForce GTX 用户带去更多游戏体验。GeForce GTX 玩家将有望通过更低的 RT 质量设置和分辨率实现光线追踪,而在 GPU 上增加专用 RT 核心后,GeForce RTX 的性能也将提高 2-3 倍,从而可以在更高帧速率下支持更高质量的设置和分辨率。

分解光线追踪性能

光线追踪为 GPU 带来了几个需要执行的新工作负载。第一个负载便是确定光线将在游戏场景中相交的三角形。为方便计算,系统中应用了一个名为 Bounding Volume Hierarchy (BVH) 的计算密集型技术。完成光线计算后,系统将采用去噪算法来改善所得图像的视觉质量,从而减少光线总投射量,为实时处理提供支持。

GeForce RTX GPU 上的 RT 核心包含用于加快 BVH 和光线/三角形交叉计算的专用硬件,可大幅提高光线追踪的效率。GeForce GTX 硬件上的这些计算在Shader cores上执行,与 GPU 的许多其他显卡功能共享这一资源。

GeForce RTX GPU 使用的 Turing 架构从一开始就是为 DXR 类型的工作负载而设计的。而 Pascal 于 2016 年推出,专为 DirectX 12 而设计。

要了解这些努力能够带来哪些实际效果,我们来看看地铁:离去 (Metro Exodus) 的一个游戏框架,该框架实现了光线追踪全局照明:

图片显示 Pascal 上的 GPU 利用率、禁用了 RT 核心的 Turing(通过特殊软件设置来显示无需使用 RT 核心时的 GeForce RTX 2080 性能),以及启用了 RT 核心和 DLSS 的 Turing。

在 Pascal 架构 GPU 上,我们看到光线追踪和所有其他图形渲染任务均由 FP32 Pascal Shader Cores负责处理。这需要花费更长的时间来执行,转换为更低的 FPS。

Turing 架构引入了 INT32 核心,伴随 FP32 核心一同运行。所有这些都可以在 GeForce RTX 显卡、GeForce GTX 1660 Ti GTX 1660 显卡上找到,大大缩短了帧周期。

当我们在 GeForce RTX GPU 上启用专用 RT 核心时,Shader Cores的工作负载会大幅提高,从而进一步改善性能。当我们只检查图形工作负载的光线追踪子集时,RTX 2080 的运行速度将提高 10 倍。

当我们考虑使用由 Turing 的 Tensor 核心驱动的 AI 加速技术“DLSS”时,地铁:离去 (Metro Exodus) 在 GeForce RTX 2080 上的帧速率比最快的 Pascal 架构的GeForce GTX 1080 Ti 上的帧速率快大约 3 倍。

下面您将看到涵盖多个光线追踪标题的性能,在 Pascal (GTX 1080 Ti) 和 Turing (RTX 2080) 上以 2560x1440 的最高游戏质量和光线追踪设置运行。下图显示按照 Turing 架构中每个组件分解后的 FPS 提升效果,Shader cores改进,如 并发浮点运算、整数预算、RT 核心和 Tensor Core (DLSS)。为了显示启用和未启用 RT 核心的 RTX 2080 性能,我们使用了特殊的软件设置。

地铁:离去 (Metro Exodus) 使用实时光线追踪全局照明,通过随着游戏世界中的光线变化和事件出现不断更新的间接照明,来渲染更为逼真的动态场景。换句话说,光线反射自然发生,自然照亮周围细节。如果太阳移动或打开遮光帘,则房间光照会与现实中一样发生变化,呈现出全新光线照射下的房间效果。

这一过程需要逐像素投射光线,导致光线追踪全局照明比渲染更简单的光线追踪效果(如有限的光线追踪反射光)的性能要求更高。这种情况下,RT 核心的引入实现了性能的大幅提升,与 GTX 1080 Ti 相比,RTX 2080 的运行速度快 3 倍。

古墓丽影:暗影 (Shadow of the Tomb Raider) 正在为即将推出的补丁增加光线追踪阴影,强化现有阴影,并引入超出传统光栅化技术能力的新型沉浸式实时阴影。这样一来,RTX 2080 的运行速度将比 GTX 1080 Ti 快 2 倍。

战地 TM  V 的 DXR 反射仅适用于反射水、玻璃、镜子和金属等表面。通过这种方法,需要的光线减少了,从而在各 GPU 之间实现更高性能。

3DMark Port Royal 将光线追踪既用于反射也用于阴影。通过光线跟踪实现多重效果会明显加重 GPU 上的 RT 工作负载,因此需要使用 RT 核心以超过 30 FPS 的速度运行基准测试程序。

正如上图显示,光线追踪性能因游戏而异,效果也各有不同。在战地 V (Battlefield V) 中,光线追踪反射光在计算上的要求没有地铁:离去 (Metro Exodus) 中对全局照明效果和古墓丽影:暗影 (Shadow of the Tomb Raider) 中对阴影效果的要求高。如果某款游戏像原子之心 (Atomic Heart) 3DMark Port Royal 一样使用多重光线追踪效果,则使用专用 RT 核心在性能上更具优势。

GeForce GTX 驱动程序支持:即将推出

预计 4 月份,当 DXR 可以通过 Game Ready 驱动程序来启动后,受支持的 GeForce GTX 显卡无需游戏更新也可工作,因为光线追踪游戏均是基于 DirectX 12 的 DirectX Raytracing API, DXR 构建起来的。作为业内标准 的API,DXR既可兼容 RT 核心之类的专用硬件单元,同时也兼容 GPU 通用Shader Cores。

另外还支持配有同等 Pascal 和 Turing GPU 的笔记本电脑

请注意,只有对于基本光线追踪功能来说,性能和内存充足的 GeForce GTX GPU 才支持更新,因为如果没有 RT 核心之类的专用硬件,光线追踪工作负载会与所有其他图形渲染任务同时运行,大幅增加 GPU 的工作负担。

实时光线追踪实现了图形行业的革命。现在,Unreal Engine 和 Unity 已推出引擎支持,激动人心的内容即将发布,本周 GDC 期间将发布多个公告,实时光线追踪任重而道远,但它的发展势头还在增长。

敬请关注 GeForce.com 了解驱动程序最新消息,查看其他 GDC 2019 文章了解更多游戏公告,如有任何问题和反馈,请提交至这里,我们的团队将会收到您的问题和反馈。