本课程将为您讲解使用 CUDA 在大规模并行 GPU 服务器上加速C/C++ 应用程序的基本工具和技能。您将使用已经部署好GPU开发环境云服务器,完成一系列的动手编码练习。学习如何编写由 GPU 加速器执行的代码,使用 CUDA 线程层次结构配并行化代码,管理和优化 CPU 和 GPU 加速器之间的内存迁移,利用命令行和可视化分析器来指导工作,以及利用并发流实现指令级并行机制。最后,利用您所学到的知识,完成一个仅支持CPU的粒子模拟器的加速任务,并获得显著地性能提升。课程完成后,您可以访问其他资源来自行创建新的GPU加速应用程序。
学习目标
完成本课程后,您将学到如何应用基本工具和技能,利用 CUDA 实现GPU加速的C / C ++应用程序,并能够:
> 编写由GPU加速器执行的代码。
>在 C/C++ 应用程序中使用 CUDA 展示和表现数据和指令级的并行机制。
>利用 CUDA 托管内存,并使用异步预取优化内存迁移。
>利用命令行和可视化分析器来指导工作。
>利用并发流进行指令级并行处理。
>使用配置文件驱动的方法编写 GPU 加速的 CUDA C/C++应用程序,或重构现有的仅支持 CPU 的应用程序。
下载课程大纲 (PDF 294 KB)