NVIDIA DLSS 3:AI 助力性能倍增,至高可将帧率提升 4 倍

由 Henry C Lin and Andrew Burnes 发表于 2022年9月20日 | 精选故事 GeForce RTX GPU NVIDIA DLSS NVIDIA RTX 光线追踪

NVIDIA DLSS 的推出为图形技术带来了翻天覆地的变化。该技术将 AI 超分辨率与 GeForce RTX GPU 上的 Tensor Core 相结合,在提升帧率的同时,生成与原生分辨率媲美的高质量清晰图像。DLSS 发布至今,已有 216 款游戏和应用采用了这项技术,不仅帧率得到提升,而且为游戏中实现实时光线追踪提供了充足的性能提升空间。  

今天,我们怀着激动的心情宣布推出 NVIDIA DLSS 3,为神经图形领域带来新一轮革命性变化!DLSS 3 将 DLSS 超分辨率技术、全新的 DLSS 帧生成技术和 NVIDIA Reflex 相结合,作为新硬件功能登陆 GeForce RTX 40 系列 GPU,相较于单纯的渲染,游戏性能最高可提升 4 倍。目前,DLSS 3 已得到业界的迅速响应,超过 35 款游戏和应用宣布将支持这项新技术,并将于 10 月登陆首批游戏/ 应用。

NVIDIA DLSS 的发展过程

我们推出 NVIDIA DLSS 的初衷,是利用基于 AI 的超高分辨率技术重新定义实时渲染,在减少像素渲染的基础上,使用 AI 构建更清晰、更高分辨率的图像。在 DLSS 推出不到两年后,我们发布了 NVIDIA DLSS 2。该技术使用通用神经网络,无需进行专门的训练即可适应所有游戏和场景,使画质和性能再次得到提升。DLSS 2 现已在 216 款游戏和应用中得到广泛使用,Unity 和虚幻引擎 (Unreal Engine) 也支持这项技术。随着我们不断训练 NVIDIA AI 超级计算机,DLSS 2 技术也在日益改进,自发布至今经历了 4 次主要升级,促进了画质的进一步提升。  

NVIDIA DLSS 3 隆重发布 – 神经图形技术更上一层楼

DLSS 3 再接再厉,为 AI 驱动的图形技术带来革命性突破,在保持出色画质和响应速度的同时大幅提升性能。DLSS 3 以 DLSS 超分辨率技术为基础,结合使用光学多帧生成技术来生成全新帧,并运用 NVIDIA Reflex 低延迟技术来优化响应速度。DLSS 3 由 NVIDIA Ada Lovelace 架构( GeForce RTX 40 系列显卡)的全新第四代 Tensor Core 和光流加速器提供支持。

DLSS 卷积自动编码帧生成器会接收 4 个输入数据:当前游戏帧、前一游戏帧、Ada 光流加速器生成的光流场,以及游戏引擎数据(例如运动矢量和深度)。 

Ada 架构中的光流加速器会分析游戏中的两个连续帧并计算光流场。光流场记录了像素从第 1 帧到第 2 帧的运动方向和速度。光流加速器可以捕捉粒子、反光、阴影、光照等像素级信息,这些信息通常不会包含在游戏引擎的运动矢量计算中。以下面的摩托场景为例,骑手的运动流准确地表现了,阴影在画面中相对于摩托车的位置大致保持不变。

光流加速器会准确跟踪像素级效果(如反光),而 DLSS 3 也会使用游戏引擎的运动矢量数据来精确跟踪场景中的几何图形运动。在下面的示例中,游戏运动矢量数据准确地跟踪了摩托车手驰经过时,道路的运动情况。但是这些数据中不包括阴影效果。仅使用游戏运动矢量来生成帧可能会导致视觉效果异常(例如阴影卡顿)。

对于每一帧,DLSS 帧生成 AI 网络都会决定如何使用来自游戏运动矢量、光流场和后续游戏帧的信息生成中间帧。通过结合使用游戏运动矢量和光流来追踪运动,DLSS 帧生成 AI 网络能够准确地重建几何图形和效果,就像下图展示的一样。

启用 DLSS 3 后,AI 会使用 DLSS 超分辨率技术重建第一帧的四分之三,并使用 DLSS 帧生成技术重建完整的第二帧。综合来看,DLSS 3 会重建所有显示帧的八分之七,使性能显著提升!

与此同时,DLSS 3 还会使用 NVIDIA Reflex 来同步 GPU 和 CPU,从而优化响应速度并降低系统延迟。降低系统延迟有助于提高游戏操作的响应速度,确保玩家在点击鼠标或输入其他控制后,屏幕上几乎瞬时就能显示相应动作。DLSS 3 至高可将系统延迟降低至原生渲染的 2 倍。 

在即将发布“赛博朋克 2077 (Cyberpunk 2077)”全极致光线追踪模式下,DLSS 3 可借助 DLSS 超分辨率技术、DLSS 帧生成技术和 NVIDIA Reflex,将性能和响应速度分别最大提升至原生渲染的 4 倍和 2 倍,而且完全不会降低出色的画质。 

 

NVIDIA DLSS 3:在 CPU 受限的情况下实现性能翻倍

DLSS 帧生成技术在 GPU 中作为后处理功能执行,所以即使游戏对 CPU 性能要求较高,也不妨碍 AI 网络提升帧率。对于受到CPU限制的游戏(例如物理计算密集型游戏或大型场景游戏),DLSS 3 可在不影响 CPU 计算的情况下,使 GeForce RTX 40 系列显卡以高达两倍的帧率处理渲染任务。例如,在“微软模拟飞行 (Microsoft Flight Simulator)”中,整个地球以真实比例 (1:1) 进行重建,而 DLSS 3 可使游戏帧数最高增加一倍。

 

NVIDIA DLSS 3:将性能提升至高可达 4 倍

在很多游戏和引擎中,DLSS 3 都能将 GeForce RTX 40 系列的性能提升至传统渲染技术的 4 倍之多:

凭借高级 AI 网络、Reflex 软件算法、专用的 Tensor Core 和光流硬件,以及能够持续训练和改进 AI 网络的 NVIDIA 超级计算机,DLSS 3 可以全面提升游戏性能。GeForce RTX 40 系列的用户可体验到所有这些创新技术,畅享更快的帧率、快速的响应和出色的画质。

NVIDIA DLSS 3:将于今年 10 月隆重发布

RTX 和 DLSS 结合了光线追踪和 AI 技术,可同时大幅提升画质和性能,这一突破性成果使电子游戏领域发生了革命性变化。

DLSS 3 以我们在游戏 AI 领域的开拓性工作为基础,至高可将性能提升 4 倍,实现全景光线追踪游戏,并为游戏玩家带来完全基于仿真的游戏,正如 NVIDIA Racer RTX 所展示的那样。

DLSS 3 得到了世界各地许多主要游戏开发者和游戏引擎的支持,目前已有超过 35 款游戏和应用宣布即将支持这项新技术,并将于 10 月登陆首批游戏/应用。 

DLSS 3 游戏可以同时兼容 DLSS 2 技术。GeForce RTX 40 系列 GPU 均支持 DLSS 3 技术。DLSS 3 包含 3 项特性:我们的全新帧生成、超分辨率(DLSS 2 的关键创新)和 Reflex。开发者只需集成 DLSS 3,游戏便可默认支持DLSS 2 。NVIDIA 会持续通过研究和训练 AI 来改进 DLSS 中的超分辨率技术,并像 DLSS 首次发布以来一样,为所有 GeForce RTX 游戏玩家提供更新。

DLSS 3 与 NVIDIA Ada Lovelace 架构的其他出众功能相结合,可为玩家带来新一代出色性能。如需详细了解 GeForce RTX 40 系列显卡、全新 Ada 技术以及支持这些技术的游戏,请访问 GeForce.cn。