本课程将为您讲解使用 CUDA 在大规模并行 GPU 服务器上加速C/C++ 应用程序的基本工具和技能。您将使用已经部署好GPU开发环境云服务器,完成一系列的动手编码练习。学习如何编写由 GPU 加速器执行的代码,使用 CUDA 线程层次结构配并行化代码,管理和优化 CPU 和 GPU 加速器之间的内存迁移,利用命令行和可视化分析器来指导工作,以及利用并发流实现指令级并行机制。最后,利用您所学到的知识,完成一个仅支持CPU的粒子模拟器的加速任务,并获得显著地性能提升。课程完成后,您可以访问其他资源来自行创建新的GPU加速应用程序。

 

学习目标

完成本课程后,您将学到如何应用基本工具和技能,利用 CUDA 实现GPU加速的C / C ++应用程序,并能够:

> 编写由GPU加速器执行的代码。

>在 C/C++ 应用程序中使用 CUDA 展示和表现数据和指令级的并行机制。

>利用 CUDA 托管内存,并使用异步预取优化内存迁移。

>利用命令行和可视化分析器来指导工作。

>利用并发流进行指令级并行处理。

>使用配置文件驱动的方法编写 GPU 加速的 CUDA C/C++应用程序,或重构现有的仅支持 CPU 的应用程序。

下载课程大纲 (PDF 294 KB)

课程大纲

介绍
(15 分钟)
  • 讲师介绍
  • 登录课程
使用 CUDA C/C++ 加速应用程序
(120 分钟)

    了解基本语法和概念,以便能够使用CUDA编写支持GPU的C / C ++应用程序:

  • 编写、编译并运行 GPU 代码
  • 控制并行线程层次结构
  • 分配和释放内存GPU
休息 (60 分钟)
使用 CUDA C/C++ 管理加速应用程序内存
(120 分钟)

    同步学习命令行分析器和 CUDA 托管内存,关注观察驱动的应用程序提升并深入理解托管内存行为:

  • 使用命令行分析器剖析 CUDA 代码
  • 深入了解统一内存
  • 优化统一内存管理
休息 (15 分钟)
异步流及使用 CUDA C/C++ 对加速应用程序开展可视化分析
(120 分钟)

    识别改进内存管理和指令级并行的机会:

  • 使用Nsight Systems 分析 CUDA 代码
  • 使用并发 CUDA 流
总结
(15 分钟)
  • 回顾所学关键内容
  • 完成测试,获取证书
  • 填写调查表
 

培训详情

课程时长:8 学时

价格:

> 公开课:每人 3500 元(提供发票)

> 企业专属培训:联系我们,微信添加 NVIDIALearn

预备知识:

> 基本的 C/C++ 编程能力,包括熟悉变量类型、循环、条件语句、函数和数组操作

> 无需预先了解CUDA编程

工具、库和框架:NVIDIA Nsight Systems

课程测评问题类型:基于技能的编码测试

培训证书:成功完成本课程和测试后,您将获得 NVIDIA DLI 证书,以证明您在这一主题领域的能力,助力您的职业发展。

学习此课程的硬件要求:您需要一台笔记本电脑或台式机,且能够运行最新版 Chrome 或 Firefox 浏览器。我们为您提供在云端完全配置的 GPU 加速工作站的专用访问权限。

课程语言:中文

学习更多 DLI 课程

加速计算基础——CUDA Python

加速计算进阶——用多 GPU 加速 CUDA C++ 应用

加速计算高阶 —— 将 CUDA C++ 应用扩展至多节点 GPU

如果您的企业希望获取或提升在 AI、加速数据科学或加速计算方面的核心技能,NVIDIA DLI 有讲师指导的培训将是您的信心之选。

遇到问题 ?