This site requires Javascript in order to view all its content. Please enable Javascript in order to access all the functionality of this web site. Here are the instructions how to enable JavaScript in your web browser.

讲师指导的培训班
使用 CUDA Python 构建 GPU 加速工作流

报名 AI 培训班

购买和咨询企业专属培训

本课程是一门 GPU-加速计算入门的动手实践课程，帮助开发者使用 NVIDIA 的 CUDA 生态系统构建快速、可扩展的应用程序。通过 notebook，参与者将掌握 CuPy 的数组加速功能、cuDF 的 GPU DataFrames 处理能力，以及 cuda-python API，用于在 Python 中编写自定义内核——全程无需离开 Python 环境。在数据科学、机器学习和科学计算中的真实世界练习中，专注提升性能、互操作性以及端到端效率。学习者将从即插即用的加速逐步过渡到完全集成的 GPU 流水线，掌握数据移动、异步执行以及使用 Nsight 工具进行性能分析。课程结束时，学员将能够把受限于 CPU 的 Python 代码转化为生产级的 GPU 解决方案，打通从原型到部署的全流程，并在现代加速计算中应用性能优化和结果可复现的最佳实践。

学习目标

参加本次培训，您将学到：

使用 CUDA Python 和可互操作的库构建端到端的 GPU-加速应用程序
在 Python 中直接编写、编译并启动自定义 CUDA 内核
使用 CuPy 和 cuDF 作为 NumPy 和 Pandas 的即插即用替代品，加速数值与分析工作负载
将 GPU 操作无缝集成到数据科学、ML 和 HPC 流水线中
利用 Nsight 性能分析工具和最佳实践设计模式，确保可复现性、性能与可扩展性

课程大纲待更新

课程大纲

课程介绍 (15 分钟)	讲师介绍登录 DLI 学习平台
CUDA Python 基础 (120 分钟)	NumPy 入门将 NumPy 加速至 CuPy 内存空间：幂迭代 (Power Iteration) 异步性：幂迭代
休息 (60 分钟)
CUDA Python 库 (120 分钟)	cuDF：GPU-加速的 DataFrames cuda-cccl：定制算法
休息 (15 分钟)
CUDA 内核 (120 分钟)	在 Python 中编写 CUDA 内核使用 Nsight Systems 和 Nsight Compute 分析代码性能
评估测试和总结 (30 分钟)	回顾关键知识点并解答问题完成评估获取 NVIDIA 培训证书填写课程反馈表
评估测试和总结 (60 分钟)	回顾所学要点通过映射将预训练模型转换为能够接收不同的数据类型，完成评估并获得证书填写培训调查表
下一步	学习更多 DLI 相关课程：加速计算基础——CUDA C++ 前沿技术构建基于 DOCA 的拥塞控制算法优化 AI 工作负载深度学习基础 —— 理论与实践入门构建基于 Transformer 的自然语言处理应用构建基于大语言模型 (LLM) 的应用为大语言模型添加新知识构建大语言模型 RAG 智能体在生产环境大规模部署 RAG 工作流利用提示工程构建大语言模型 (LLM) 应用使用多模态模型构建 AI 智能体