TESLA

GPU 应用

机器学习

工业与学术界的数据科学家已将 GPU 用于机器学习以便在各种应用上实现开创性的改进,这些应用包括图像分类、视频分析、语音识别以及自然语言处理等等。 尤其是深度学习,人们在这一领域中一直进行大力投资和研究。深度学习是利用复杂的多级「深度」神经网络来打造一些系统,这些系统能够从海量的未标记训练数据中进行特征检测。 

虽然机器学习已经有数十年的历史,但是两个较为新近的趋势促进了机器学习的广泛应用: 海量训练数据的出现以及 GPU 计算所提供的强大而高效的并行计算。  人们利用 GPU 来训练这些深度神经网络,所使用的训练集大得多,所耗费的时间大幅缩短,占用的数据中心基础设施也少得多。  GPU 还被用于运行这些机器学习训练模型,以便在云端进行分类和预测,从而在耗费功率更低、占用基础设施更少的情况下能够支持远比从前更大的数据量和吞吐量。

将 GPU 加速器用于机器学习的早期用户包括诸多顶级规模的网络和社交媒体公司,另外还有数据科学和机器学习领域中一流的研究机构。 与单纯使用 CPU 的做法相比,GPU 具有数以千计的计算核心、可实现 10-100 倍应用吞吐量,因此 GPU 已经成为数据科学家处理大数据的首选处理器。

 

针对机器学习应用的基准测试

针对机器学习应用的基准测试

"借助 GPU,预先录制的语音或多媒体内容的转录速度能够大幅提升。 与 CPU 软件相比,我们执行识别任务的速度最高可提升 33 倍。"

Ian Lane 教授, 卡耐基梅隆大学

 
 

了解其他数据科学家如何推进自己在机器学习领域中的工作,了解工具、软件架构以及计算配置等有助于自己快速入门的信息。

 
 
机器学习工具
  • Caffe: 用于脑回神经网络算法的架构
  • cuda-convnet: 脑回神经网络的高性能 C++/CUDA 软件实施
  • Theano: 用于定义、优化以及评估数学公式的 Python 库
  • Torch7: 用于机器学习算法的科学计算架构 
  • cuBLAS: GPU 加速版本的完整标准 BLAS 库
  • MATLAB: 简单易用的 HPC 语言集成计算、可视化以及编程
  • cxxnet: 神经网络工具包
最近有关机器学习的文章
有关机器学习的技术演讲
 
有关机器学习的技术论文
 
将 GPU 用于机器学习的公司和研究机构
Adobe Baidu Facebook Flickr IBM
Microsoft Netflix Nuance Yandex  
 
推荐的系统配置
开发工作站 训练集群
2 颗 NVIDIA Tesla K40 GPU 加速器 8 颗 NVIDIA Tesla K40 GPU 加速器
2 颗 Intel 至强 CPU (8 核或更高级别) 2 颗 Intel 至强 CPU (8 核或更高级别)
64 GB 系统内存 256 GB 系统内存
 

配置选项

配置选项
 
 

如需了解如何购买 GPU 加速器,敬请访问在哪里购买 Tesla 页面。