本课程是一门 GPU-加速计算入门的动手实践课程,帮助开发者使用 NVIDIA 的 CUDA 生态系统构建快速、可扩展的应用程序。通过 notebook,参与者将掌握 CuPy 的数组加速功能、cuDF 的 GPU DataFrames 处理能力,以及 cuda-python API,用于在 Python 中编写自定义内核——全程无需离开 Python 环境。在数据科学、机器学习和科学计算中的真实世界练习中,专注提升性能、互操作性以及端到端效率。学习者将从即插即用的加速逐步过渡到完全集成的 GPU 流水线,掌握数据移动、异步执行以及使用 Nsight 工具进行性能分析。课程结束时,学员将能够把受限于 CPU 的 Python 代码转化为生产级的 GPU 解决方案,打通从原型到部署的全流程,并在现代加速计算中应用性能优化和结果可复现的最佳实践。
学习目标
参加本次培训,您将学到:
- 使用 CUDA Python 和可互操作的库构建端到端的 GPU-加速应用程序
- 在 Python 中直接编写、编译并启动自定义 CUDA 内核
- 使用 CuPy 和 cuDF 作为 NumPy 和 Pandas 的即插即用替代品,加速数值与分析工作负载
- 将 GPU 操作无缝集成到数据科学、ML 和 HPC 流水线中
- 利用 Nsight 性能分析工具和最佳实践设计模式,确保可复现性、性能与可扩展性
课程大纲待更新
