本课程将为您讲解使用 CUDA 在大规模并行 GPU 服务器上加速C/C++ 应用程序的基本工具和技能。您将使用已经部署好GPU开发环境云服务器,完成一系列的动手编码练习。学习如何编写由 GPU 加速器执行的代码,使用 CUDA 线程层次结构配并行化代码,管理和优化 CPU 和 GPU 加速器之间的内存迁移,利用命令行和可视化分析器来指导工作,以及利用并发流实现指令级并行机制。最后,利用您所学到的知识,完成一个仅支持CPU的粒子模拟器的加速任务,并获得显著地性能提升。课程完成后,您可以访问其他资源来自行创建新的GPU加速应用程序。
完成本课程后,您将学到如何应用基本工具和技能,利用 CUDA 实现GPU加速的C / C ++应用程序,并能够:
> 编写由GPU加速器执行的代码。
>在 C/C++ 应用程序中使用 CUDA 展示和表现数据和指令级的并行机制。
>利用 CUDA 托管内存,并使用异步预取优化内存迁移。
>利用命令行和可视化分析器来指导工作。
>利用并发流进行指令级并行处理。
>使用配置文件驱动的方法编写 GPU 加速的 CUDA C/C++应用程序,或重构现有的仅支持 CPU 的应用程序。
下载课程大纲 (PDF 294 KB)
了解基本语法和概念,以便能够使用CUDA编写支持GPU的C / C ++应用程序:
同步学习命令行分析器和 CUDA 托管内存,关注观察驱动的应用程序提升并深入理解托管内存行为:
识别改进内存管理和指令级并行的机会:
课程时长:8 学时
价格:
> 公开课:每人 3500 元(提供发票)
> 企业专属培训:联系我们,微信添加 NVIDIALearn
预备知识:
> 基本的 C/C++ 编程能力,包括熟悉变量类型、循环、条件语句、函数和数组操作
> 无需预先了解CUDA编程
工具、库和框架:NVIDIA Nsight Systems
课程测评问题类型:基于技能的编码测试
培训证书:成功完成本课程和测试后,您将获得 NVIDIA DLI 证书,以证明您在这一主题领域的能力,助力您的职业发展。
学习此课程的硬件要求:您需要一台笔记本电脑或台式机,且能够运行最新版 Chrome 或 Firefox 浏览器。我们为您提供在云端完全配置的 GPU 加速工作站的专用访问权限。
课程语言:中文
8 学时 | 中文 | 收费培训 | CUDA, Python, Numba, NumPy
有培训证书
8 学时 | 中文 | 收费培训 | CUDA C++, NVIDA Nsight™ Systems
8 学时 | 中文 | 收费培训 | CUDA, MPI, NVSHMEM
如果您的企业希望获取或提升在 AI、加速数据科学或加速计算方面的核心技能,NVIDIA DLI 有讲师指导的培训将是您的信心之选。
NVIDIA 深度学习培训中心 (DLI) 培训证书可以证明在相关领域的能力,助力您的职业发展。部分在线自主培训和全部讲师指导的培训班课程,提供此证书。
在 LinkedIn 上张贴 DLI 证书,可以突显您的新技能。这样做有机会增加对招聘者的吸引力,从而推动您的职业生涯发展。参考这里的操作步骤来更新您的简历,将证书添加到“证书”一项中。