讲师指导的培训班
使用 CUDA Python 构建 GPU 加速工作流

本课程是一门 GPU-加速计算入门的动手实践课程,帮助开发者使用 NVIDIA 的 CUDA 生态系统构建快速、可扩展的应用程序。通过 notebook,参与者将掌握 CuPy 的数组加速功能、cuDF 的 GPU DataFrames 处理能力,以及 cuda-python API,用于在 Python 中编写自定义内核——全程无需离开 Python 环境。在数据科学、机器学习和科学计算中的真实世界练习中,专注提升性能、互操作性以及端到端效率。学习者将从即插即用的加速逐步过渡到完全集成的 GPU 流水线,掌握数据移动、异步执行以及使用 Nsight 工具进行性能分析。课程结束时,学员将能够把受限于 CPU 的 Python 代码转化为生产级的 GPU 解决方案,打通从原型到部署的全流程,并在现代加速计算中应用性能优化和结果可复现的最佳实践。

 

学习目标

参加本次培训,您将学到:

  • 使用 CUDA Python 和可互操作的库构建端到端的 GPU-加速应用程序
  • 在 Python 中直接编写、编译并启动自定义 CUDA 内核
  • 使用 CuPy 和 cuDF 作为 NumPy 和 Pandas 的即插即用替代品,加速数值与分析工作负载
  • 将 GPU 操作无缝集成到数据科学、ML 和 HPC 流水线中
  • 利用 Nsight 性能分析工具和最佳实践设计模式,确保可复现性、性能与可扩展性

课程大纲待更新

课程大纲

课程介绍
(15 分钟)
  • 讲师介绍
  • 登录 DLI 学习平台
CUDA Python 基础
(120 分钟)
  • NumPy 入门
  • 将 NumPy 加速至 CuPy
  • 内存空间:幂迭代 (Power Iteration)
  • 异步性:幂迭代
休息 (60 分钟)
CUDA Python 库
(120 分钟)
  • cuDF:GPU-加速的 DataFrames
  • cuda-cccl:定制算法
休息 (15 分钟)
CUDA 内核
(120 分钟)
  • 在 Python 中编写 CUDA 内核
  • 使用 Nsight Systems 和 Nsight Compute 分析代码性能
评估测试和总结
(30 分钟)
  • 回顾关键知识点并解答问题
  • 完成评估获取 NVIDIA 培训证书
  • 填写课程反馈表
评估测试和总结
(60 分钟)
  • 回顾所学要点
  • 通过映射将预训练模型转换为能够接收不同的数据类型,完成评估并获得证书
  • 填写培训调查表
下一步
 

培训详情

课程时长:8 小时,课后 6 个月内可以继续访问课件(实验资源用量有限额)

价格:

  • AI 培训班:每人 3500 元(提供发票)
  • 企业专属培训:联系我们,微信添加 NVIDIALearn

预备知识:

  • 基本的 Python 能力,包括变量类型、循环、条件语句、函数和数组操作
  • 具备 NumPy 使用能力,包括 ndarrays 和 ufuncs 的使用
  • 学员无需具备 CUDA 编程相关知识
  • 使用的工具、库和框架: cuPycuDFNVIDIA Nsight™ Systems

培训证书:成功完成本课程和测试后,学员将获得 NVIDIA DLI 培训证书,证明在相关领域的能力,为职业发展提供证明。

学习此课程的硬件要求:您需要一台能够上网的笔记本电脑或台式机,且能够运行最新版 Chrome 或Firefox 浏览器;我们为您提供在云端实验环境的专用访问权限。

课程语言:中文

学习更多 DLI 课程

加速计算基础——CUDA C++ 前沿技术

构建基于 DOCA 的拥塞控制算法优化 AI 工作负载

深度学习基础 —— 理论与实践入门

构建基于 Transformer 的自然语言处理应用

构建基于大语言模型(LLM) 的应用

为大语言模型添加新知识

构建大语言模型 RAG 智能体

在生产环境大规模部署 RAG 工作流

利用提示工程构建大语言模型 (LLM) 应用

使用多模态模型构建 AI 智能体

如果您的企业希望获取或提升在 AI、加速数据科学或加速计算方面的核心技能,NVIDIA DLI 有讲师指导的培训将是您的信心之选。

遇到问题 ?