本课程教授如何使用基本的工具和技术,通过在GPU上的CUDA® 和NUMBA编译器,来加速Python应用程序的运行。在GPU支持的实时云端开发环境上, 您将完成十几个动手编码练习,并在培训结束时实践一个新的工作流程,来加速全功能但仅支持 CPU 的线性代数程序,从而获得显著的性能提升。 课程结束后,您将拥有更多资源来自行创建新的GPU加速应用程序。

 

学习目标

课程结束后,您将了解使用 CUDA 和 Numba 实现GPU加速Python 应用程序的基本工具和技能。

> 只需使用几行代码即可实现 GPU 加速的 NumPy ufuncs 。

> 利用CUDA线程层次结构配置代码并行化。

> 编写自定义 CUDA 核函数实现最大性能和灵活性。

> 使用内存合并和设备上共享内存来增加CUDA核函数的带宽。

下载课程大纲 (PDF 298 KB)

课程大纲

简介
(15 分钟)
  • 讲师介绍
  • 创建账户和登录课程
使用 Numba 的 CUDA Python 入门
(120 分钟)
  • 在 Python 中用 Numba 编译器和 CUDA 编程
  • 使用 Numba 装饰器加速数值 Python 函数
  • 优化主机到设备、设备到主机的内存传输
休息 (60 分钟)
在支持 Numba 的 Python 中自定义 CUDA核函数
(120 分钟)
  • 学习 CUDA 的并行线程层次结构,以及如何扩展并行程序
  • 在GPU上启动大规模并行自定义CUDA核函数
  • 利用CUDA原子操作避免并行执行期间的竞争状况
休息 (15 分钟)
有效使用内存子系统
(120 分钟)
  • 学习创建多维网格以及如何在2D 矩阵上并行工作
  • 在重塑2D矩阵时,利用GPU设备上的共享内存来促进内存合并
总结
(15 分钟)
  • 回顾所学关键内容
  • 完成测试,获取证书
  • 填写调查表
 

培训详情

课程时长:8 学时

价格:

> 公开课:每人 3500 元(提供发票)

> 企业专属培训:联系我们,微信添加 NVIDIALearn

预备知识:

> 基本的 Python 编程能力,包括熟悉变量类型、循环、条件语句、函数和数组操作

> 使用 NumPy 的能力,包括使用 ndarrays 和 ufuncs

> 无需具备前期 CUDA 编程知识

工具、库和框架:Numba、NumPy

课程测评问题类型:基于技能的编码测试

培训证书:成功完成本课程和测试后,您将获得 NVIDIA DLI 证书,以证明您在这一主题领域的能力,助力您的职业发展。

学习此课程的硬件要求:您需要一台笔记本电脑或台式机,且能够运行最新版 Chrome 或 Firefox 浏览器。我们为您提供在云端完全配置的 GPU 加速工作站的专用访问权限。

课程语言:中文

学习更多 DLI 课程

加速计算基础——CUDA C/C++

加速计算进阶——用多 GPU 加速 CUDA C++ 应用

加速计算高阶 —— 将 CUDA C++ 应用扩展至多节点 GPU

如果您的企业希望获取或提升在 AI、加速数据科学或加速计算方面的核心技能,NVIDIA DLI 有讲师指导的培训将是您的信心之选。

遇到问题 ?