从引擎更新到惊艳刺激的游戏,再到开发人员工具,NVIDIA 及其合作伙伴不断在 GDC 2019 上发布一系列光线追踪公告,旨在推动生态系统围绕这项激动人心的新技术继续前进
几十年来,NVIDIA 一直有一个梦想,就是要实现视频游戏的实时光线追踪。但这需要投入数百万小时的研发工作,需要关注从 GPU 硬件和软件到更新版 API 和游戏引擎,再到开发工具和降噪器的方方面面。2018 年,所有的努力随着 GeForce RTX GPU 的推出开花结果,GeForce RTX GPU 是全球首款带有专用 RT 核心光线追踪硬件的消费级显卡,能够以高保真和高分辨率实现逼真的光线追踪效果。
从那时起,我们的软件和开发团队就一直在努力,支持我们开展光线追踪技术优化工作,进行新的软件改进,并帮助开发人员进一步提高游戏中的光线追踪性能。正是这些努力让我们得以大幅提高 GeForce RTX GPU 的光线追踪性能。预计 4 月,我们将能够通过 Game Ready 驱动程序更新在 GeForce GTX 1060 6GB 及更高版本显卡上启用 DirectX Raytracing (DXR)。
对支持 RT 的 GPU 来说,更大的存量用户有助于推动开发人员采用光线追踪技术,为 GeForce RTX 和 GeForce GTX 用户带去更多游戏体验。GeForce GTX 玩家将有望通过更低的 RT 质量设置和分辨率实现光线追踪,而在 GPU 上增加专用 RT 核心后,GeForce RTX 的性能也将提高 2-3 倍,从而可以在更高帧速率下支持更高质量的设置和分辨率。
光线追踪为 GPU 带来了几个需要执行的新工作负载。第一个负载便是确定光线将在游戏场景中相交的三角形。为方便计算,系统中应用了一个名为 Bounding Volume Hierarchy (BVH) 的计算密集型技术。完成光线计算后,系统将采用去噪算法来改善所得图像的视觉质量,从而减少光线总投射量,为实时处理提供支持。
GeForce RTX GPU 上的 RT 核心包含用于加快 BVH 和光线/三角形交叉计算的专用硬件,可大幅提高光线追踪的效率。GeForce GTX 硬件上的这些计算在Shader cores上执行,与 GPU 的许多其他显卡功能共享这一资源。
GeForce RTX GPU 使用的 Turing 架构从一开始就是为 DXR 类型的工作负载而设计的。而 Pascal 于 2016 年推出,专为 DirectX 12 而设计。
要了解这些努力能够带来哪些实际效果,我们来看看地铁:离去 (Metro Exodus) 的一个游戏框架,该框架实现了光线追踪全局照明:
图片显示 Pascal 上的 GPU 利用率、禁用了 RT 核心的 Turing(通过特殊软件设置来显示无需使用 RT 核心时的 GeForce RTX 2080 性能),以及启用了 RT 核心和 DLSS 的 Turing。
在 Pascal 架构 GPU 上,我们看到光线追踪和所有其他图形渲染任务均由 FP32 Pascal Shader Cores负责处理。这需要花费更长的时间来执行,转换为更低的 FPS。
Turing 架构引入了 INT32 核心,伴随 FP32 核心一同运行。所有这些都可以在 GeForce RTX 显卡、GeForce GTX 1660 Ti 和 GTX 1660 显卡上找到,大大缩短了帧周期。
当我们在 GeForce RTX GPU 上启用专用 RT 核心时,Shader Cores的工作负载会大幅提高,从而进一步改善性能。当我们只检查图形工作负载的光线追踪子集时,RTX 2080 的运行速度将提高 10 倍。
当我们考虑使用由 Turing 的 Tensor 核心驱动的 AI 加速技术“DLSS”时,地铁:离去 (Metro Exodus) 在 GeForce RTX 2080 上的帧速率比最快的 Pascal 架构的GeForce GTX 1080 Ti 上的帧速率快大约 3 倍。
下面您将看到涵盖多个光线追踪标题的性能,在 Pascal (GTX 1080 Ti) 和 Turing (RTX 2080) 上以 2560x1440 的最高游戏质量和光线追踪设置运行。下图显示按照 Turing 架构中每个组件分解后的 FPS 提升效果,Shader cores改进,如 并发浮点运算、整数预算、RT 核心和 Tensor Core (DLSS)。为了显示启用和未启用 RT 核心的 RTX 2080 性能,我们使用了特殊的软件设置。
地铁:离去 (Metro Exodus) 使用实时光线追踪全局照明,通过随着游戏世界中的光线变化和事件出现不断更新的间接照明,来渲染更为逼真的动态场景。换句话说,光线反射自然发生,自然照亮周围细节。如果太阳移动或打开遮光帘,则房间光照会与现实中一样发生变化,呈现出全新光线照射下的房间效果。
这一过程需要逐像素投射光线,导致光线追踪全局照明比渲染更简单的光线追踪效果(如有限的光线追踪反射光)的性能要求更高。这种情况下,RT 核心的引入实现了性能的大幅提升,与 GTX 1080 Ti 相比,RTX 2080 的运行速度快 3 倍。
古墓丽影:暗影 (Shadow of the Tomb Raider) 正在为即将推出的补丁增加光线追踪阴影,强化现有阴影,并引入超出传统光栅化技术能力的新型沉浸式实时阴影。这样一来,RTX 2080 的运行速度将比 GTX 1080 Ti 快 2 倍。
战地 TM V 的 DXR 反射仅适用于反射水、玻璃、镜子和金属等表面。通过这种方法,需要的光线减少了,从而在各 GPU 之间实现更高性能。
3DMark Port Royal 将光线追踪既用于反射也用于阴影。通过光线跟踪实现多重效果会明显加重 GPU 上的 RT 工作负载,因此需要使用 RT 核心以超过 30 FPS 的速度运行基准测试程序。
正如上图显示,光线追踪性能因游戏而异,效果也各有不同。在战地 V (Battlefield V) 中,光线追踪反射光在计算上的要求没有地铁:离去 (Metro Exodus) 中对全局照明效果和古墓丽影:暗影 (Shadow of the Tomb Raider) 中对阴影效果的要求高。如果某款游戏像原子之心 (Atomic Heart) 和 3DMark Port Royal 一样使用多重光线追踪效果,则使用专用 RT 核心在性能上更具优势。
预计 4 月份,当 DXR 可以通过 Game Ready 驱动程序来启动后,受支持的 GeForce GTX 显卡无需游戏更新也可工作,因为光线追踪游戏均是基于 DirectX 12 的 DirectX Raytracing API, DXR 构建起来的。作为业内标准 的API,DXR既可兼容 RT 核心之类的专用硬件单元,同时也兼容 GPU 通用Shader Cores。
另外还支持配有同等 Pascal 和 Turing GPU 的笔记本电脑
请注意,只有对于基本光线追踪功能来说,性能和内存充足的 GeForce GTX GPU 才支持更新,因为如果没有 RT 核心之类的专用硬件,光线追踪工作负载会与所有其他图形渲染任务同时运行,大幅增加 GPU 的工作负担。
实时光线追踪实现了图形行业的革命。现在,Unreal Engine 和 Unity 已推出引擎支持,激动人心的内容即将发布,本周 GDC 期间将发布多个公告,实时光线追踪任重而道远,但它的发展势头还在增长。
敬请关注 GeForce.com 了解驱动程序最新消息,查看其他 GDC 2019 文章了解更多游戏公告,如有任何问题和反馈,请提交至这里,我们的团队将会收到您的问题和反馈。