Tesla

Tesla 软件功能

 
 

NVIDIA® Tesla® GPU计算产品专为工作站以及数据中心的高性能计算而设计。 有许多 CUDA 软件特性都是专为 GPGPU 而设计的,而且只有 Tesla 产品才支持这些特性。 下表对此进行了总结。

软件应用程序
         描述           支持 Matrix           下载
Windows 的高性能驱动程序: TCC 驱 动程序
针对 Windows 的 Tesla 驱动程序
可实现远程桌面、Windows 服务
可减少启动软件内核的系统总开销
专为 CUDA C/C++ 而设计
C 系列 GPU: Windows Vista、Windows 7
M 系列和 S 系列产品: Windows HPC Server 2008 以及 2008 R2
可从下列网站下载:http://www.nvidia.com/
驱动程序
选择 Tesla 产品以及操作系统
M 系列驱动程序可从 OEM 厂商处获得。
GPU 监控: nvsmi
GPU 温度
风扇转速
ECC 信息
M 系列和 S 系列产品
Windows 和 Linux
可从下列网站下载Tesla驱动程序:http://www.nvidia.com/
驱动程序
选择 Tesla 产品以及操作系统
GPU 集群管理
排他模式: 只让特定应用程序访问某一特定 GPU
GPU 可视设备:环境变量,让集群管理软件能够限制应用程序可以使用的 Tesla GPU。
M 系列和 S 系列产品
Windows 和 Linux
可从下列网站下载 Tesla 驱动程序:http://www.nvidia.com/
驱动程序
选择 Tesla 产品以及操作系统
NVIDIA GPUDirect™ v1.0
让 GPU 能够与 InfiniBand 适配器更快通信的 NVIDIA® Tesla® 解决方案
C-系列, M-系列和S-系列产品
仅限于红帽子企业版 Linux (RHEL) 5.4
   下载
Tesla 驱动程序
RHEL 内核补丁
InfiniBand OFED 驱动程序
安装说明
NVIDIA GPUDirect™ v2.0
GPU 点对点通信
所有 Tesla 20系列GPU
CUDA Toolkit 4.1 支持的所有 Linux 以及 Windows 版本或更高版本
可从下列网站下载 Tesla 驱动程序:http://www.nvidia.com/
驱动程序
选择 Tesl a产品以及操作系统
   了解更多信息...

注: CUDA 注册开发者 现在可以下载 CUDA 4.1 候选版本。

针对 WINDOWS 的 TCC 驱动程序
TCC (Tesla 计算机集群)驱动程序是一种用于 CUDA C/C++ 的 Windows 驱动程序,该驱动程序可实现远程桌面、服务并能够在 Windows 上减少 CUDA 内核启动的系统总开销。 请注意,TCC 驱动程序可禁用 Tesla 产品上的图形功能。

GPU 监控
针对 Tesl a的 GPU 监控软件可以利用 nvsmi 工具来获得。 该工具目前能够给出 GPU 温度、风扇转速以及 ECC 信息。 随着我们新增更多的 GPU 监控特性,nvsmi 将不断发展。

GPU 集群管理
NVIDIA® 与多家集群管理软件供应商均保持着合作关系,这些供应商支持基于GPU 的系统:

Bright Computing
ClusterCorp Rocks
Platform Computing

除了这些以外,CUDA 驱动程序还支持两种重要的特性:

排他模式: 只让特定应用程序访问某一 GPU
GPU 可视设备: 通过控制应用程序能够使用哪些 GPU,从而让集群管理软件能够管理 GPU 资源。

NVIDIA® GPUDIRECT™
通过消除不必要的 CPU 处理时间,NVIDIA GPUDirect 技术让 GPU 能够与 PCIe 总线上的其它设备更快地通信。 GPUDirect v1.0 让第三方设备驱动程序 (例如用于 InfiniBand 适配器的驱动程序) 能够直接与 CUDA 驱动程序通信,消除了在 CPU 上复制数据所需的处理时间。 GPUDirect v2.0 让同一系统中的多个 GPU 之间能够实现点对点 (P2P) 通信,避免了额外的 CPU 处理时间。


利用 NVIDIA GPUDirect,消除了从缓冲区 1 至缓冲区 2 的存储器拷贝。


GPUDirect v2.0 Peer-to-Peer Communication

GPUDirect v2.0 Peer-to-Peer Communication