NVIDIA 深度学习学院

深度学习和加速计算应用开发培训
全配置云端GPU实验资源

NVIDIA开发者社区免费培训课程介绍

CUDA 并行计算编程基础

目标受众:针对有GPU平台程序开发需求的开发人员

时长:1小时

课程介绍:CUDA编程方法是目前广泛使用的并行化程序编程方法。在深度学习,计算机视觉,生物医疗,环境科学,气象预报,石油勘探等领域具有大量的使用场景。通过这堂课,您将学会:

  • GPU基本架构
  • CUDA编程模型---包括CUDA的线程层次,如何更加高效的调用线程来执行程序命令
  • CUDA访存处理---包括多种存储类型的调用,以及如何利用不同类型的存储加速CUDA程序
  • CUDA多流执行---包括创建多流执行的CUDA程序,以及利用多流执行加速CUDA程序的方法

在本次课程中,还会以实际程序为例子,详细展示如何在实际应用中利用GPU加速我们的应用程序

使用 NVIDIA免费工具TensorRT加速推理实践----YOLO目标检测

目标受众:对于TensorRT有一定基础的开发人员

时长:1个小时

课程介绍:

此课程将会介绍如何利用TensorRT加速YOLO目标检测,课程将会着重介绍编程方法。本次课程还会涉及到TensorRT中数据类型,流处理,多精度推理等细节的展示:

  • TensorRT简介
  • TensorRT优化YOLO的实战编程
  • TensorRT实例展示

利用NVIDIA开源免费工具DIGITS实现生成对抗网络(GAN)

目标受众:针对有图像处理和机器视觉知识背景的开发者

时长:1个小时

课程介绍:

此课程将协助用户开发出定制免编程GAN训练工具,会详细介绍如何利用NVIDIA 免费开源工具DIGITS实现对抗生成网络(GAN)的训练,如何安装自定义组建,如何测试训练效果等内容:

  • NVIDIA DIGITS简介
  • 数据集的处理
  • DIGITS组件的安装
  • GAN的调试
  • 测试

人工智能课程:使用 TensorRT 加速推理结果计算 ,配合 Deepstream

目标受众:针对有模型训练知识背景的技术人员

时长:1小时

课程介绍:

此课程将会介绍TensorRT的基本信息,包括:

  • TensorRT的性能特点
  • TensorRT的优化原理
  • TensorRT的开发方法细节
  • TensorRT 和 TensorFlow的集成开发方法
  • Deepstream 的性能特点以及开发使用

GPU人工智能服务器的搭建

目标受众: 针对有GPU平台程序开发需求的技术人员

时长:1小时

课程介绍:

在这门课中,您将学会如何从头开始配置一台GPU AI服务器,我们会结合硬件系统和软件系统介绍完整的解决方案。内容包括:

  • 硬件平台系统的搭建
  • GPU的性能特点
  • 当前已经成熟的解决方案
  • 软件系统的安装配置
  • CUDA,cuDNN 以及 NVIDIA DeepLearning SDK 的介绍

完成上述实验,您可以自己根据不同的需求,配置一台包含软件和硬件的成熟系统。

NVIDIA交互式GPU训练平台: DIGITS - 开源免费的深度学习管理工具

目标受众: 针对有图像处理和机器视觉知识背景的人员

时长:1.5小时

课程介绍:

  • DIGITS诞生背景及功能简介
  • DIGITS的训练数据集导入
  • DIGITS的基本模型训练操作:图片分类
  • DIGITS用于目标检测
  • DIGITS用于图像分割
  • DIGITS迁移学习的使用
  • DIGITS Plugin的使用

课程咨询及开课时间请微信添加社区小助手了解

社区小助手