
NVIDIA®(英伟达™)Tesla™ S2050 1U计算系统仅以十分之一的成本以及二十分之一的功耗便能够实现超级计算能力,从而为GPU进入现有部门集群以及数据中心提供了最大灵活性。
特性
基于新一代Fermi CUDA架构的GPU |
与基于典型四核CPU的纯CPU系统相比,该GPU以十分之一的成本和二十分之一的功耗即可实现集群性能。 |
448个计算核心 |
每颗GPU最高可实现515 Gigaflop双精度峰值性能,从而在1U空间内即可实现2 Teraflops的双精度性能。每颗GPU的单精度峰值性能超过1 Teraflop。 |
ECC存储器 |
杰出的计算精度与可靠性能够满足关键应用的重要需求。能够为存储器中的数据提供保护功能,从而为应用程序增强数据完整性和可靠性。寄存器文件、L1/L2高速缓存、共享存储器以及DRAM均受ECC的保护。 |
系统监控特性 |
通过NVSMI,简化了管理与远程监控后期安装。无论IT人员处于机架的前面还是后面,产品前后两侧的状态灯都能够确保他们看到设备运行状态。 |
每颗GPU最多配备6GB GDDR5存储器 |
更大的数据集能够保存在直接附属于GPU的本地存储器上,从而实现了性能的最大化并减少了数据传输的情况。Tesla S2050的每颗GPU配备3GB存储器。 |
NVIDIA®(英伟达™)并行DataCache™ |
能够为物理效果解算器、光线追踪以及稀疏矩阵乘法等诸多算法加速,在这些算法中,数据地址事先都是未知的。每个流式多处理器模块均包含一个可配置的L1高速缓存,所有处理器核心使用统一的L2高速缓存。 |
NVIDIA®(英伟达™)GigaThread™引擎 |
通过多项技术实现了吞吐量的最大化,其中包括10倍于上一代架构的高速上下文切换、并发内核执行以及改良的线程块调度。 |
异步传输 |
计算核心在处理其它数据的同时还能够在PCIe总线上传输数据,因而增强了系统性能。即便是地震处理这类需要大量数据传输的应用程序,也能够通过事先将数据传输至本地存储器的方法来最大限度提升计算效率。 |
CUDA编程环境受到各种编程语言与API的广泛支持 |
开发人员无论选择C语言、C++、OpenCL、DirectCompute还是选择Fortran语言,都能够实现应用程序的并行机制,进而利用“Fermi”GPU的创新架构。 |
高速PCI-Express Gen 2.0数据传输率 |
实现了主系统与Tesla处理器之间带宽的最大化。让Tesla系统能够应用于几乎所有具备一条开放式PCI-E插槽(x8或x16)且符合PCIe规范的主系统。 |
点击注册,即可接收最新资讯通知,以便了解有关Tesla产品与加速应用程序的更多信息。