NVIDIA®(英伟达™)与合作伙伴构筑业内最广泛的并行计算开发生态系统

 
 

种类繁多、基于标准的工具和库全部围绕CUDA架构而开发

2009年11月17日,美国俄勒冈州波特兰市,2009年超级计算大会 - NVIDIA®(英伟达™)公司(纳斯达克代码:NVDA)及其生态系统内的合作伙伴将在接下来的几个月里为采用GPU计算的开发者发布各种软件,这些软件所涉范围之广将是业内前所未有的。

这些更新将包含各种GPU计算开发语言、工具以及库的大改版(Major Release)。其中包括NVIDIA®(英伟达™)对CUDA™ C语言编译器的更新,新增了对下列两项内容的支持:C++以及即将问世、代号为“Fermi”的GPU(图形处理器)。NVIDIA®(英伟达™)还将发布其R195驱动程序,其中包含了针对OpenCL 1.0驱动程序的全新扩展、工具包以及代号NVIDIA®(英伟达™)Nexus的Beta版本。NVIDIA®(英伟达™)Nexus是业内首款针对大规模并行计算的开发环境,集成在Microsoft Visual Studio之中。

除了NVIDIA®(英伟达™)自己的更新以外,软件工具方面的行业领军企业现已发布了一些合作伙伴版本,其中包括Portland Group的CUDA Fortran解决方案、Allinea公司的分布式调试工具(DDT)以及TotalView调试器。

NVIDIA®(英伟达™)公司GPU计算软件总经理Sanford Russell表示:“在极耗资源的应用程序中提升性能的唯一有效途径是将其移植到并行计算模型上来。凭借着业内最广泛的支持、针对大规模并行计算的软件咨询以及培训资源网络,NVIDIA®(英伟达™)CUDA架构能够促进实现这一关键性转变。”

NVIDIA®(英伟达™)及其合作伙伴并行计算开发工具的更新包含下列内容:

CUDA工具包3.0 Beta版本凭借CUDA工具包3.0 Beta版本,开发者现在就能够开始为NVIDIA®(英伟达™)Fermi架构开发应用程序。这款Beta版本包含了诸多特性,例如ECC报告、双DMA引擎、内核同时执行以及CUDA-gdb中对NVIDIA®(英伟达™)Fermi硬件调试的支持。其中还包含了性能分析功能,既能够用于CUDA Visual Profiler又能够用于OpenCL Visual Profiler。该版本还包括了对全新统一互操作性API的支持,这种API针对的是Direct3D与OpenGL,其中还包括Direct3D 11。

OpenCL 1.0扩展NVIDIA®(英伟达™)是唯一一家在支持OpenCL特性方面超越了最低合规级别的企业。NVIDIA®(英伟达™)所发布的全新扩展包括对双精度、OpenGL互操作性以及全新OpenCL可安装客户端设备(ICD)的支持。这些全新特性加大了NVIDIA®(英伟达™)对2D图像、32位原子学以及字节可寻址存储的现有支持力度,目前,也只有NVIDIA®(英伟达™)一家公司能够提供对上述内容的支持。

NVIDIA®(英伟达™)“Nexus”是业内首款大规模并行GPU应用程序专用开发环境的代号,这一开发环境集成在Microsoft Visual Studio IDE当中,由调试器、性能分析器以及图形检查器组成。本次所发布的Beta版本通过通用、简单的工具,让GPU计算开发人员能够快速提升生产率。

Portland Group(PGI) – CUDA Fortran语言它是全球首款兼容NVIDIA®(英伟达™)CUDA GPU的Fortran语言编译器生产版本。对于这些使用Fortran语言应用程序的领域,CUDA Fortran语言将加快它们采用GPU计算的步伐。这些领域包括海洋建模、天气预报、环境建模、地震分析、生物信息学以及其它领域。

本周还发布了AllineaTotalView所出品的专业HPC调试解决方案。这些工具能够提供CUDA GPU的诸多特性,对使用Linux平台上MPI、OpenMP以及pthreads的现有并行调试功能构成了很好的补充。它让开发人员能够对混合型集群上运行的应用程序进行调试,这些集群由x86-64 CPU与基于Tesla GPU的服务器组成。

数值分析软件包:在杰出的数值分析与数学建模软件包中,CUDA GPU的运用也实现了长足的进步。此类软件包包括Mathworks公司的MATLAB、Wolfram Research公司的Mathematica以及国家仪器公司的LabVIEW

CUDA库:此外,开发者还能够利用丰富的CUDA加速库,这些库由NVIDIA®(英伟达™)及其合作伙伴推出,其中包括BLAS、FFT、LAPACK(EM Photonics CULA)、MAGMA(田纳西大学诺克斯维尔分校创新计算实验室)、NVIDIA性能基元(NPP)、CUDA Vision Workbench(CVWB)以及视频与图像处理库。

为加速CUDA优化工具与应用程序的发展势头,用户可以利用越来越多CUDA 咨询机构所提供的全球培训与咨询服务。这些咨询机构包括Acceleware公司、ANEO、CAPS、Elegant Mathematics、EM Photonics、Fixstars、GASS公司、HPC Project、Infosys、SagivTech、Stone Ridge Technology以及Tech-X公司。

基于CUDA并行处理架构的NVIDIA®(英伟达™)图形处理器(GPU)现已支持所有这些语言、API、库以及其它工具。这些内容所涉范围之广说明了当今并行计算领域已经拥有业内最灵活、最普遍的工具集。

关于NVIDIA®(英伟达™)公司

1999年,NVIDIA®(英伟达)公司发明了图形处理器(GPU),让全世界重新认识了计算机图形的威力。自那时起,NVIDIA®(英伟达™)不断为视觉计算树立全新标准,其令人叹为观止的交互式图形产品可广泛用于便携式媒体播放器、笔记本、工作站等各种设备之上。NVIDIA®(英伟达)在可编程GPU(图形处理器)方面拥有先进的专业技术,在并行处理方面实现了诸多突破,从而普及了低价超级计算机的使用。在《财富》杂志半导体行业创新排行榜上,NVIDIA®(英伟达™)连续两年位居榜首。如需了解更多信息,敬请访问www.nvidia.cn

媒体咨询,请联络:

NVIDIA®(英伟达™)中国区公关经理 金洋先生(Steven Jin)
电话:(8610)-58661502
E-mail: jiyang@nvidia.com

宣亚国际公关
北京市朝阳区建国路甲92号世茂大厦B座14层 邮编100022
联系人:陈仲禹、李碣石先生
电话:(8610)8507 9258/9240
传真:010-85079555
E-mail:gary.chen@shunyagroup.com
          jesse.li@shunyagroup.com

与基于CPU的集群相比,基于全新Fermi架构的Tesla产品能够以十分之一的成本 以及二十分之一的功耗实现同等性能

Tesla_C2050-C2070
Tesla C2050 GPU Computing Processor
Tesla_S2070
Tesla S2070 GPU Computing System

2009年11月16日,美国俄勒冈州波特兰市,2009年超级计算大会 - 2NVIDIA®(英伟达™)公司(纳斯达克代码:NVDA)于今日正式推出专门针对高性能计算(HPC)市场的Tesla 20系列并行处理器,该系列处理器基于代号为“Fermi”的新一代CUDA™处理器架构。

< NVIDIA®(英伟达™)Tesla™ 20系列GPU(图形处理器)完全专为并行计算而设计,与基于传统CPU的集群相比,Tesla™ 20系列GPU能够以十分之一的成本以及二十分之一的功耗实现同等性能,从而大幅削减了计算成本。

Tesla 20系列引入了一系列特性,让诸多全新应用程序能够利用GPU计算大幅提升运行速度。这些应用程序包括光线追踪、3D云计算、视频编码、数据库搜索、数据分析、计算机辅助工程以及病毒扫描等等。

田纳西大学创新计算实验室主任、LINPACK以及LAPACK的联合作者Jack Dongarra表示:“NVIDIA®(英伟达™)公司在Fermi中采用了极具吸引力的架构,其中所包含的诸多特性让科技能够造福于整个计算行业。”

Tesla 20系列GPU(图形处理器)集众多并行计算特性于一身,在单一设备上,这是史无前例的。这些特性包括:

  • 支持下一代IEEE 754-2008双精度浮点标准
  • ECC(纠错代码),能够实现无与伦比的可靠性与精确性
  • 多级缓存分层结构,拥有1级缓存以及2级缓存
  • 支持C++编程语言
  • 内存容量最多可达1 TB、同时内核执行、快速上下文切换、原子指令10倍速度提升、64位虚拟地址空间、系统调用以及递归函数等等

在核心层次,Tesla GPU基于大规模并行CUDA计算架构,它为开发者提供了一个并行计算模型。与过去50年里所开发的其它同类产品相比,该模型更易于理解和编程。

伊利诺伊大学厄本那香槟分校电气与计算机工程系教授胡文美(Wen-mei Hwu)博士表示:“无疑,计算的未来将是并行处理,计算机科学系的学生非常有必要在全新并行架构编程方面打下坚实的基础。GPU与CUDA编程模型让学生能够快速理解并行编程的概念以及立即实现全面的速度提升。”

Tesla 20系列-GPU产品包括:

  • Tesla C2050以及C2070 GPU计算处理器
  • 面向工作站配置的单块GPU PCI-Express Gen-2卡
  • 最多3GB以及6GB(各自的容量)板载GDDR5存储器(1)
  • 双精度性能范围为520GFlops - 630 GFlops
  • Tesla S2050以及S2070 GPU计算系统
  • 1U系统外形中集成了四颗Tesla GPU,面向集群以及数据中心的部署需求
  • 系统内存总容量为最多12GB以及24GB(各自的容量)板载GDDR5存储器(2)
  • 双精度性能范围为2.1 TFlops - 2.5 TFlops

Tesla C2050以及C2070产品零售价将为2,499美元以及3,999美元,Tesla S2050以及S2070零售价将为12,995美元以及18,995美元。这些产品将于2010年第二季度上市。如需了解有关全新Tesla 20系列产品的更多信息,敬请访问Tesla产品页面
编者注:正如之前所宣布过的一样,首款基于Fermi的消费级(GeForce®)产品预计将于2010年第一季度上市。

(1)启用ECC,用户可用内存容量为2.625GB(C2050)以及5.25GB(C2070)
(2)启用ECC,用户可用内存容量为10.5GB(S2050)以及21GB(S2070)。

关于NVIDIA®(英伟达™)公司

1999年,NVIDIA®(英伟达)公司发明了图形处理器(GPU),让全世界重新认识了计算机图形的威力。自那时起,NVIDIA®(英伟达™)不断为视觉计算树立全新标准,其令人叹为观止的交互式图形产品可广泛用于便携式媒体播放器、笔记本、工作站等各种设备之上。NVIDIA®(英伟达)在可编程GPU(图形处理器)方面拥有先进的专业技术,在并行处理方面实现了诸多突破,从而普及了低价超级计算机的使用。在《财富》杂志半导体行业创新排行榜上,NVIDIA®(英伟达™)连续两年位居榜首。如需了解更多信息,敬请访问www.nvidia.cn

媒体咨询,请联络:

NVIDIA®(英伟达™)中国区公关经理 金洋先生(Steven Jin)
电话:(8610)-58661502
E-mail: jiyang@nvidia.com

宣亚国际公关
北京市朝阳区建国路甲92号世茂大厦B座14层 邮编100022
联系人:陈仲禹、李碣石先生
电话:(8610)8507 9258/9240
传真:010-85079555
E-mail:gary.chen@shunyagroup.com
          jesse.li@shunyagroup.com




###

© NVIDIA公司版权所有,2012年。保留所有权利。所有的公司和/或产品名称可能是与之对应的所有者的商标和/或注册商标。特性、价格、供货时间和规范可在未加通知的情况下加以更改。

编者注:如果您希望了解有关NVIDIA的更多信息,请访问NVIDIA的新闻室: http://cn.nvidia.com/page/press_room.html