x
... loading movie ...

作者 Andrew "Exitios" Dolicho
游戏对太多的特性均提出了要求。我们凭借雨点般子弹对战成群的敌人,用一连串魔法斩杀凶猛的怪兽,领导军队战胜邪恶的帝国,消除银河系的威胁,如果我们有时间的话,也许甚至还要拯救一两个公主。 当我们完成了所有这些任务之后要做什么呢? 我们再来一遍,不过这次要增加数量! 我们想要加大难度、更快地完成任务以及获得更强的升级道具。 我们只是想要更好的结果,而玩家期待不仅仅是图形效果: 我们想要明确的光照与阴影、清晰的纹理、细腻的世界、自然的物理效果、干净的边缘,以及最重要的是高帧速率。 说到快速呈现令人毛骨悚然的视觉特效,NVIDIA 的 SLI 技术是一项专门的强化利器。
本指南将介绍 NVIDIA 的 SLI 技术,它是一种创新特性,可以在数以千计的 PC 游戏中增强性能和图像质量。 在这篇文章中,我们将了解到 SLI 究竟是什么、看看它是如何发挥作用的、探索各种硬件要求、对不同的视觉设置与 NVIDIA Control Panel 中的组件进行分门别类、了解如何使它最大限度地为我们工作。 虽然这里的详细度不会是极致水平,但是仍然涵盖了大量内容,因此如果你想要看更易于消化的内容,敬请参阅 -{RaptoR}- 发表的 SLI 常见问题。

最佳的入门方法是了解 SLI 实际上是什么,因此让我们直入主题: SLI 是一种多 GPU (图形处理器) 扩展引擎,从本质上来讲这是一种利用一块以上的显卡来提升游戏性能的方法,每额外增加一颗 GPU,性能最多增加 100%。 原理十分简单,使用起来也同样简单,因为所有现代 GeForce 图形驱动程序和诸多 GeForce GPU 均很好地包含了该项技术。 我们将谈及一点具体的要求,然而现在,让我们来详细了解一下 SLI 是如何工作的。
NVIDIA 的 SLI 技术是一种并行机制的运用,而并行机制是 GPU 已经大规模运用的机制。 一般来讲,SLI 系统会被认定为「n 路 SLI」配置,在本指南中: 「双路 SLI」指使用两块 SLI 显卡的任意系统,「三路 SLI」指使用三块 SLI 显卡的任意系统,而「四路 SLI」则表示拥有四块 SLI 显卡或 GPU 的任意系统 (以符合两块双 GPU SLI 显卡的情形)。通过让多颗图形处理器能够独立地渲染单一 3D 环境,理论上我们能够让帧速率达到单颗 GPU 时的帧速率与 GPU 数量相乘的水平。 这是通过图形驱动程序来实现的,驱动程序可确定 GPU 如何工作和指派自己负责渲染哪些数据。 在场景载入之后,一旦 CPU 完成了「预渲染」任务,例如为对象设置顶点、碰撞检测、AI 行为、界面更新、音频处理以及网络通信等等,以 SLI 方式链接在一起的显卡就会收到渲染信息,这些信息可确定屏幕上最终会出现什么内容以及如何出现。 这类数据存放于单独的显存空间内并在多块显卡之间共享,因为他们全部渲染同一个环境。那么,我们就来谈一谈这些 GPU 是如何协同工作的: 交替帧渲染 (AFR) 用于提升性能,SLI 抗锯齿 (SLI AA) 用于提供杰出的图像质量。

交替帧渲染是针对 SLI 的高性能渲染模式,它通过向每颗 GPU 指定特定的帧子集来发挥作用。 例如在双路 SLI 配置中,GPU 1 将渲染所有的奇数帧,而 GPU 2 则渲染所有的偶数帧。 当使用三颗或四颗 GPU 时,这些 GPU 分别渲染三帧或四帧当中的一帧。 AFR 的基本原理是尽量保持 GPU 独立地工作,以最大限度提升性能,这需要一个明确的 SLI 渲染配置文件。 这些内容被写下来并不断针对不同的游戏而进行优化,因此大家要经常看看有没有新的 GeForce 驱动程序发布! 如果你想要提交针对某一游戏或 3D 应用程序的 SLI 配置文件更新的申请,敬请点击此处。

SLI 抗锯齿是一种专注于图像质量的渲染模式,它将一份抗锯齿 (AA) 工作进行分割,分配给多颗 GPU,从而在降低性能代价的情况下呈现出更加光滑的边缘效果。 在双路 SLI 中,虽然两颗 GPU 均渲染同一个帧,但是却利用位移覆盖点执行子像素采样,这种采样能够合并在一起以大大提升图像的光滑度。 三路和四路 SLI 系统可以使用这一选项,工作方式类似。 这一模式非常适合性能可以接受但是想要更高画质的情形。通过在多颗 GPU 之间分担 AA 工作,游戏的视觉效果得到了提升,与使用单颗 GPU 时相比,并没有付出什么性能代价。 例如,双路 SLI AA 8x 的性能与单颗 GPU 运行 4x AA 的性能相当,然而图像质量明显提升。 NVIDIA Control Panel 中可以找到这一选项,「Antialiasing - Mode」下拉菜单中的所有应用程序配置文件均可使用该选项,这一选项会自动忽略该配置文件的既定 SLI 渲染模式或使之失效。

在继续讲解之前,让我们暂停一下,考虑一下多 GPU 最主要的特点是什么: 扩展。 因此我们的意思是说,我们能从增加的 GPU 上获得多少好处,例如用增加一颗 (双路 SLI) 或三颗 (四路 SLI) 后的性能来与单颗 GPU 的性能进行对比。 理想情况是,性能会随着额外设备的加入而直线上升,这意味着,如果我们加入第二颗 GPU,那么就会看到性能翻一番。 实际上,双路 SLI 的提升幅度与此接近。 三路和四路 SLI 系统也可以得出惊人的结果,然而它们容易表现出性能回报递减的趋势,这是因为增加的 GPU 数量越多,就越受 CPU 的限制。
SLI 扩展效果好不好取决于游戏应付多颗 GPU 的效率有多高、针对该游戏的 SLI 配置文件有多先进、以及我们可以让 GPU 保持在多忙的程度。 最后一部分意味着,我们在影响扩展效果的因素中负有一定的责任: 确保 GPU 是我们系统中的瓶颈。 然而这并不十分直接,因为我们可以通过单单确定哪一个子系统等待的时间最长(例如区区几毫秒或几十毫秒),来定义硬件的局限性。而扩展无法准确预测或在某一游戏的单一区域内也不完全一致,因为渲染条件可以快速变化,但是正如我们马上就会看到的一样,多 GPU 系统会产生瓶颈效应的另一面。
如果我们要在双路 SLI 系统中大幅简化生成帧的过程,那么就要测量每一个零部件完成自己那份工作所花的时间,可能就像下列图像之一一样。 如图所示,每一帧都首先由 CPU 进行准备,然后递交给 GPU 进行渲染。
这些代表情形也许看似极端,但是并不是不现实。 在左图中,我们看到了一台完全受限于 CPU 的双路 SLI 系统,因为 GPU 完成工作的速度远高于 CPU,所以添加第二块显卡当然无法实现性能提升。 在右图中,我们看到了我们的每一颗 GPU 均远比 CPU 渲染所花的时间长,第二块显卡的出现有效地令帧速率实现了翻倍。 CPU 甚至还有足够的停工时间来容纳第三块显卡,增加第三块显卡可以实现更高的性能!
然而如前所述,事情并非一直都是表面那样。 CPU 仅比 GPU 慢一点点是完全有可能的,反之亦然,这足够我们开始看到 GPU 扩展效果较差或额外 GPU 的优化不足了。 虽然在这种情况下依然能够看到性能提升,但问题是我们实际上得到的好处有多少,因此让我们来看一个案例,案例中的系统添加了第二块显卡,在该系统中,CPU 在处理其任务上仅略微比 GPU 强一点点:

在我们的系统中采用第二块显卡产生了大约 15% 以上的性能提升,然而我们的 GPU 出现了之前没有过的停工时间。 更重要的是,我们的 CPU 现在不断在忙于准备全新的帧画面,在 CPU 能够为 GPU 提供另一幅帧信息的很久以前,每颗 GPU 均完成了帧渲染,我们又回到了受 CPU 限制的情形。 如果我们想要看到第二块显卡的处理能力被更好地利用,这意味着我们需要进行一些调整。
在这幅插图的情况中: 对于双路 SLI 系统来说,目的是在与单 GPU 渲染相比之下,让我们的 CPU 最多仅用一半的时间便完成某一帧的预渲染。 任何一个零部件都不一定要限制另一个,我们将看到第二颗 GPU 所带来的全部好处。 然而如果你想要随后添加一颗或两颗 GPU,我们就必须大幅裁剪 CPU 的时间或增加 GPU 渲染时间。 与单 GPU 配置相比,对于三路和四路 SLI 配置来说,CPU 应该最多要 (分别) 花费三分之一或四分之一的时间。
无论我们想要试图管理多少颗 GPU,结论都将是,这并不一定是一个很差的情形。 GPU 停工时间意味着我们以更低的帧速率代价或者也许根本不用任何代价便能够提升游戏画质,如果我们要不断提出这一理念,那么我们便能够强迫 GPU 成为系统瓶颈,进一步提高 GPU 扩展能力。
我们可以尝试对 CPU 进行超频以便试图减少 GPU 闲置时间,然而这种方法最多只在某种程度上有好处,它不一定是每个人的首选。 一些简单得多的选项包括提高游戏分辨率 (例如在多台显示器上玩游戏)、提升图形设置或启用新设置 (环境光遮蔽、抗锯齿、景深、绘图距离、视野、高动态范围、光照特效、运动模糊、PhysX、反射、阴影质量、曲面细分以及纹理质量等等) 或升级至 3D Vision。 所有这些选项不仅会让我们的游戏视觉效果更好,而且会增加 GPU 的渲染时间,这可以演变为更好的扩展表现。

我们既然已经知道了什么是 SLI 以及它如何工作,那么让我们来看一看需要些什么才能利用它。 有三大方面我们必须重点考虑: 显卡、主板以及电源。 GeForce.cn 网站上有详细的清单,列出了所有这些零部件,因此你需要知道的所有信息和选购要点都可以在 SLI 技术章节找到。
如果你已经在大约前五年内购买了一颗 NVIDIA GeForce GPU,那么你很有可能已经拥有了一块支持 SLI 技术的显卡。 在哪些 GPU 可以组成 SLI 配置这方面的限制非常少: 唯一的限制是显卡型号和显存容量必须一致。 例如,一块具备 1.5GB 显存的 GTX 580 只能搭配另一块具备 1.5GB 显存的 GTX 580,而一块 GTX 690 只能搭配另一块 GTX 690。 除此之外,不同制造商的显卡可以搭配使用 (例如华硕搭配微星,EVGA 搭配 PNY),时钟频率可以不同 (公版频率与工厂超频),每一块显卡的 VGA BIOS 可以不同,不需要特定的驱动程序或软件。 下表列举了支持 SLI 技术的现代市售 GeForce 显卡,所有这些显卡至少支持双路 SLI,在符合合适要求 (主板、电源、操作系统) 的情况下,特别标注出来的 GPU 可支持三路或四路 SLI 配置。

有兴趣详细了解某一特定的 SLI GPU 吗? 敬请查看完整清单。
值得注意的是,搭配使用频率不同的显卡时,驱动程序将不会尝试同步它们的频率,除非你利用工具指示驱动程序这样做,这类工具有 EVGA Precision 或 MSI Afterburner 等等。 这完全是可以自行选择的,不这样做并不会导致任何负面影响,但是有些人发现,如果多颗 GPU 以相同的频率工作,那么超频起来更容易/更稳定。 假如你选择让多块显卡以不同步的时钟频率运行,那么我们建议将更快的 GPU 用作主显卡,这样单 GPU 或扩展效果较差的应用程序就能够得益于其略高一点的性能。
选好了 GPU 之后,我们就需要选主板和电源了,主板应支持多块 PCI-Express NVIDIA GPU,而电源应该能够驱动所有硬件。 你可以点击下列图标,查看支持 SLI 技术的主板与高性能电源的全面清单。

除了开始使用 SLI 和开始微调我们的系统以获得最佳性能和画质以外,也没什么可说的了。 我们将从设置和启用 SLI 开始讲起,最后大家会了解到,NVIDIA Control Panel 中的哪些设置会在我们的游戏中带来大不同。
在显卡安装到主板上并接好电源之后,我们强烈鼓励用户同时安装 SLI 桥接器 (所有支持 SLI 技术的主板都具备)。双路 SLI 配置需要使用一个双插头式桥接器,而六插头式桥接器是用于三路 SLI 系统的。 超高端主板可能会额外提供一个八插头式桥接器,它用于以四块独立显卡组成四路 SLI 配置 (与使用两块 GTX 690 这样的双 GPU 显卡组成四路 SLI 相对)。双路桥接器并不存在技术上「正确」的朝向问题,如果 SLI 配置中的两块显卡有两个金手指端口 (表示支持三路 SLI),那么桥接器就不需要安装到特定的显卡上,也可以使用两个单独的双路桥接器,但是这纯粹属于美学问题了,因为并不会实现性能提升。 虽然在大多数 GPU 上,并没有明确要求使用桥接器来启用双路 SLI,但是它能够为 GPU 之间交换数据提供专门的通信路径。 当没有这一链路时,PCIe 总线就会成为通信途径,这会降低性能。 由于共享的数据量非常大,因此三路和四路 SLI 配置必须使用桥接器。
应该首先指出哪些操作系统支持哪些类型的 SLI。 所有 32 位和 64 位的 Windows Vista、Windows 7、Windows 8 以及 Linux 均支持双路 SLI。 所有 32 位和 64 位的 Windows Vista、Windows 7 以及 Windows 8 均支持三路和四路 SLI。 如果你要使用多台显示器,敬请点此查看要求和连接图。
当操作系统检测到你安装了新显卡时,NVIDIA GeForce 图形驱动程序就会检查它们的 SLI 兼容性。 如果通过了检查,那么 NVIDIA Control Panel 就会通过新增或更新一个名为「Configure SLI, Surround, Physx」的新的 3D Settings 树状部分,来反映出这一点。点击该链接即可打开配置面板,其中会包含多个单选按钮 (如果你没有使用一台以上的显示器,那么某些按钮可能是灰色的)。如下图所示,你需要的只是选择「Maximize 3D Performance」选项并点击 NVIDIA Control Panel 右下角的「Apply」即可。 当图形驱动程序为 SLI 而重新配置自身和 GPU 时,你的屏幕会变黑并闪烁,可能会闪烁若干次。 一旦回到桌面状态,在接下来的几秒内,系统就会问你想要保存设置还是恢复原状。如果你在规定时间之前不选择某一选项的话,安全起见,驱动程序就会恢复至非 SLI 状态,以防你的显示器在这一过程结束时无法恢复。

了解 SLI 扩展效果如何并不一定要确切地了解一颗 GPU 提供了每秒多少帧的帧速率。 NVIDIA Control Panel 包含了一款专门用于测量 SLI 扩展效果的工具: Visual Indicators。 在启用 SLI 的情况下,只要点击「3D Settings」树中的任意链接即可,在顶端也会有一个叫做「3D Settings」的菜单。还会有一个「Show SLI Visual Indicators」的选项,点击它就能够启用 Visual Indicators。 如果旁边有一个对勾的话,就表示它已经启用。 如果没有对勾,表示它已经关闭。 两个白色的竖条将出现在屏幕的左侧,中间会有一个绿色方框。 随着 SLI 扩展效果的提升,该方框会增大,因此方框越高,表示 GPU 扩展效果越好。而方框越短,则表示性能提升越有限。
剩下的就是逐一详解我们一直谈论的这些应用配置文件。 在 NVIDIA Control Panel 的「Manage 3D Settings」标签页中,我们有一个选项,可以在全局配置文件和某一应用程序配置文件之间进行选择。 全局配置文件会影响 GPU 的默认渲染效果。 除非某一应用程序配置文件已经更改以使用特定的设置,否则就应用这一全局设置 (以下情形除外: 如果我们在全局配置文件中使用 16x AF,那么所有游戏都将以 16x AF 设置运行)。应用程序配置文件可以控制针对特定游戏或应用程序的视觉设置,这些设置可令全局设置失效,从而允许更精细的控制水平,以便让该应用程序实现最佳性能与画质。 为了破译大量的选项,让我们首先将视觉设置与功能性设置分开。 视觉设置能够产生可观察到的差异,让游戏中的对象或表面看起来有所不同。而功能性设置会改变 GPU 的行为方式。




