NVIDIA 深度学习学院

在 GPU云上的应用开发实践培训

NVIDIA 深度学习学院 (DLI) 提供 AI 和加速计算方面的实践培训,以期解决实际应用方面的问题。基于云端 GPU 平台,开发者、数据科学家、研究人员和院校师生可以获取和丰富相关的实践经验,并获得培训证书,为职业发展提供有力证明。

个人学习可以从“在线自主培训”开始,团体或企业培训可以从“讲师指导的培训班”开始学习。DLI 同时为大学师生提供更多的培训资源和支持。

  • 个人学习

  • 团体培训

  • 大学资源

对于个人、学生和少于20人的团体,建议从在线自主培训开始,学习如何将深度学习应用到实际的项目中,和如何用CUDA和OpenACC加速应用。通过在云端GPU平台上的动手实践培训,您将能够获得可用于工作中的实用技能,并获得培训证书。此外,您还可以查看和参加即将公开举办的DLI讲师指导的培训班。

在线自主培训课程

随时随地访问完全配置的GPU云服务器、按照课件中的详细指导进行自主学习和动手实践。您可以选择8小时的课程来实施和部署端到端的应用项目,或者选择2小时的课程来学习特定技术的应用。大多数8小时的课程含有培训证书,可以助力您的职业发展。

提供认证证书

深度学习课程

深度学习——通用基础

  • 深度学习基础 —— 计算机视觉

    预备知识: 熟悉编程基础知识,如函数和变量

    框架: Caffe,DIGITS

    Assessment Type: Code-based

    课程时长: 8 小时

    语言: 中文

    价格: 90 美元

    提供认证证书:学习完成后,通过在线测试,系统将自动发送证书

    通过训练神经网络和利用训练成果提升性能和能力,探索深度学习的基础原理。

    在本课程中,您将亲手训练和部署神经网络,从而了解深度学习的基础知识,将学习如何:

    • 实践常规的深度学习工作流程,例如图像分类和目标检测
    • 用数据、训练参数、网络结构和其他策略进行试验,以便提升性能和能力
    • 部署您的神经网络来解决实际问题

    完成本课程后,您将能够利用深度学习来解决现实中的问题。

  • 在Jetson Nano上开始使用AI

  • 使用 DIGITS 实现图像分类

    预备知识:

    框架: Caffe (DIGITS 界面)

    课程时长: 2 小时

    语言: 中文

    价格: 30 美元

    深度学习提供全新的解决方案,用从示例中学习到的模型来替换手写代码指令。本课程将通过以下方式训练深度神经网络以识别手写数字:

    • 将图像数据加载到训练环境
    • 选择和训练网络
    • 用新数据进行测试并迭代以提高性能

    完成本课程后,您将能够评估应该使用哪些数据进行训练。

  • 使用 DIGITS 实现目标检测

    预备知识: 神经网络基础知识经验

    框架: Caffe (DIGITS 界面)

    课程时长: 2 小时

    语言: 中文

    价格: 30 美元

    通过检测航空图像中鲸鱼的面部,来学习如何应用深度学习进行目标检测。

    • 将传统的计算机视觉与深度学习相结合
    • 基于深度学习框架Caffe对现有神经网络结构进行修改
    • 通过使用专门构建的网络和端到端标记的数据来掌握深度学习相关知识

    完成本课程后,您将能够用深度学习来解决实际应用中的问题。

  • 使用 TensorRT 优化和部署 TensorFlow 模型

    预备知识: TensorFlow 和 Python 应用经验

    框架: TensorFlow, Python, TensorRT (TF-TRT)

    课程时长: 2 小时

    语言: 英文

    价格: 30 美元

    学习使用内置TensorRT库(TF-TRT)和Python在TensorFlow平台中生成高性能深度学习模型的基础知识

    将探索:

    • 如何预处理分类模型,冻结图和权值以进行优化
    • 熟悉使用 FP32、FP16 和 INT8 进行图形优化和量化的基本原理
    • 使用 TF-TRT API 优化子图并选择最适合您的模型的优化参数
    • 在 ython 中设计和嵌入定制操作,以减少非支持层问题,并优化检测模型

    完成本课程之后,您将了解如何利用 TF-TRT 来实现可部署的优化模型。

  • 使用 RAPIDS 加速数据科学工作流

    预备知识: 具有Pandas、NumPy和scikit-learn 高阶技能

    框架:

    课程时长: 2 小时

    语言: 英文

    价格: 30 美元

    通过开源 RAPIDS 项目,数据科学家可以用 GPU 对他们的数据科学和分析应用实现端到端的加速,突破传统的仅基于 CPU 工作流的技术限制,并可以实现巨大的性能提升。通过以下课程,学习如何用GPU加速数据科学应用程序:

    • 使用关键的 RAPIDS 库,如 cuDF(支持 GPU 的 Pandas 数据帧)和 cuML(GPU 加速的机器学习算法)
    • 学习基于 GPU 加速创建的快速迭代周期的端到端数据科学的技术和方法
    • 了解 CPU 驱动和 GPU 驱动的数据科学之间的关键差异,包括 API 特性和重构的最佳实践

    完成本课程后,您将能够重构现有的仅基于 CPU 的数据科学工作负载以实现在 GPU 上更快运行,并从零开始编写加速的数据科学工作流程。

  • 使用 TensorFlow 实现图像分割

    预备知识: 神经网络基础知识经验

    框架: TensorFlow

    课程时长: 2 小时

    语言: 英文

    价格: 30 美元

    图像(或语义)分割是将图像的每个像素放置到特定类中的任务。学习如何用核磁共振成像来测量心脏的部分:

    • 将图像分割与其他计算机视觉问题进行比较
    • 练习使用 TensorFlow 工具,比如 TensorBoard 和 TensorFlow Python API
    • 学习评估模型性能的有效指标

    完成本课程后,您将能够使用深度学习来建立大多数计算机视觉工作流程。

  • 使用 DIGITS 实现信号处理

    预备知识: 神经网络基础知识经验

    框架: Caffe, DIGITS

    课程时长: 2 小时

    语言: 中文

    价格: 30 美元

    深度神经网络比人类更擅长图像分类,这一事实超出了我们对计算机视觉的通常认知。在此实验中,您将把射频 (RF) 信号转换为图像,以检测被噪音破坏的弱信号。您将学习:

    • 如何像处理图像数据一样处理非图像数据
    • 如何在 DIGITS 中实践深度学习工作流程(加载、训练、测试、调整)
    • 用编程方式测试性能并指导性能改进

    完成本课程后,您将能够使用深度学习对图像和类图像数据进行分类。

深度学习——数字内容生成

  • 使用 Torch 实现图像风格迁移

    预备知识: CNN 基础知识经验

    框架: Torch

    课程时长: 2 小时

    语言: 英文

    价格: 30 美元

    学习通过提取视觉特征,将一张图片的风格转移到另一张图片上。了解卷积神经网络如何提取特征,以及如何利用这些特征生成一个新的图片。您将学到:

    • 提取图像视觉特征,并将这些特征迁移到另一张图片
    • 通过多种手段验证特征是否迁移成功
    • 利用这种新的架构和训练技术,进行任意的图像特征迁移

    完成本课程后,您将能够使用神经网络进行任意的特征迁移。这种快速的迁移技术,还可以应用到视频中。

  • 使用自编码器实现渲染图像去噪

    预备知识: CNN 基础知识经验

    框架: TensorFlow

    课程时长: 2 小时

    语言: 英文

    价格: 30 美元

    学习如何利用带有自编码器的神经网络,来显著提升光线追踪图像的降噪速度。在这堂课中,将学到:

    • 渲染的图像中是否存在噪点
    • 使用预训练的神经网络或者您自己的网络在图像中去噪
    • 使用提供的数据集来训练自己的降噪器

    完成本课程后,将能够使用神经网络中的自编码器来训练您自己的图像渲染的降噪器。

  • 基于自编码器实现图像超分辨率

    预备知识: CNN 基础知识经验

    框架: Keras

    课程时长: 2 小时

    语言: 中文

    价格: 30 美元

    运用带有自编码器的神经网络,将低画质源图像生成高画质图像。在本次课程中,您将:

    • 学习并设计自编码器
    • 习精确测量画质的各类方法

    完成实验后,您将能够使用自编码器以大幅提升画质。

深度学习——医疗医学

  • 在 Keras 中通过时间递归神经网络(RNN)为时间序列数据建模

    预备知识: 深度学习基础知识

    框架: Keras

    课程时长: 2 小时

    语言: 英文

    价格: 30 美元

    时间递归神经网络(RNNs)允许模型基于时间序列数据做分类或预测任务,如自然语言处理、市场数据分析等等。在这个实验室里会利用 RNN 来分析病人的长期健康状况,通过这个实验,您可以学习:

    • 基于 HDF5 的电子健康档案数据来创建训练和测试数据集
    • 预处理数据集用于作为 RNN 输入,RNN 可以处理极其复杂的序列数据
    • 构建一个特殊的RNN架构——长短时记忆模型(LSTM),并利用基于 Theano 的 Keras 库来评估模型性能

    完成本课程后,您可以使用RNN来构建基于时间序列数据的模型。

  • 使用 MedNIST 数据集进行医学图像分类

    预备知识: Python 应用经验

    框架: PyTorch

    课程时长: 2 小时

    语言: 英文, 中文

    价格: 30 美元

    了解深度学习在放射学和医学成像领域的应用介绍。 您将学习如何:

    • 收集、格式化和标准化医学图像数据
    • 在数据集上构建并训练卷积神经网络(CNN)
    • 使用已经训练完的模型对新的医学图像进行分类

    完成本课程后,您将能够应用 CNN 在医学影像数据集中实现图像分类。

  • 应用深度学习数据科学工作流在医疗领域

    预备知识: CNN 和Python 基础知识经验

    框架: PyTorch

    课程时长: 2 小时

    语言: 英文

    价格: 30 美元

    医学数据集对深度学习的应用提出了特殊的挑战。 您将在本课程中学习:

    • 学习数据增强和标准化的基础技术
    • 将这些技术用于简单的医学影像数据集
    • 通过在增强数据集上训练卷积神经网络来验证您所掌握的技能

    完成本课程后,您将能够将简单的数据处理技术应用于您的医学影像数据集。

  • 使用 DIGITS 实现医学影像分割

    预备知识: CNN 和 Python 基础知识

    框架: DIGITS, Caffe

    课程时长: 2 小时

    语言: 英文

    价格: 30 美元

    图像(或语义)分割是将图像的每个像素放置到特定类中的任务。您将用核磁共振成像来测量心脏的部分:

    • 使用自定义 Python 层扩展 Caffe
    • 实施迁移学习流程
    • 根据热门的图像分类网络创建全卷积神经网络

    完成本课程后,您将能够使用深度学习来建立大多数计算机视觉工作流程。

  • 使用 TensorFlow 实现图像分类:放射组学 - 1p19q 染色体状态分类

  • 使用 R 和 MXNet 实现医学影像分析

    预备知识: CNN 和 Python 基础知识

    框架: MXNet

    课程时长: 2 小时

    语言: 中文

    价格: 30 美元

    卷积神经网络 (CNN) 可用于医学影像分析,以根据非视觉图像推断患者的病情。学习如何训练 CNN ,根据 MRI 时间序列数据推理人类心脏左心室的容积。您将学习:

    • 扩展标准的 2D CNN 以应用于更复杂的数据中
    • 通过标准的 Python API 和 R 使用 MXNet
    • 处理可能为立体且拥有时间动态变化的高维度图像

    完成本课程后,您将了解如何使用 CNN 处理非视觉图像。

  • 使用 GAN 对医学图像进行数据集扩展与图像分割

  • 将由粗到细的上下文记忆应用于医学影像

    预备知识: CNN 基础知识经验

    框架: TensorFlow

    课程时长: 2 小时

    语言: 英文

    价格: 30 美元

    由粗到细的上下文记忆 (CFCM) 是一项专为图像分割开发的技术,该技术采用极深的网络架构,并能通过卷积长短期记忆 (LSTM) 机制集成多种不同尺度的特征。您将能够:

    • 深入了解用于医学影像分割的编码器-解码器架构
    • 了解常见的构建组件(卷积、池化层和残差网络等)
    • 研究用于跳转连接的不同策略

    完成本课程后,您将能够在医学影像分割和类似的成像任务中应用 CFCM 技术。

  • 使用 DragoNN 、 Keras 和 Theano 应用深度学习于基因组学

深度学习——智能视频分析

  • 使用 TensorRT 实现智能视频分析部署

    预备知识: Basic CNN 基础知识经验 and C++

    框架: TensorRT

    课程时长: 2 小时

    语言: 中文

    价格: 30 美元

    部署训练好的神经网络模型,从而对新的输入进行推理,是一个重要的过程,TensorRT 是提高网络推理性能的重要工具。在此课程中,您将:

    • 了解如何使用 giexec 来运行推理
    • 使用INT8精度的数据类型来优化推理
    • 利用 Plugins 的方法自定义网络层

    完成本课程后,您将学会如何利用 TensorRT 来加速神经网络的推理性能。

  • 使用 DeepStream 的智能视频分析 AI 工作流

加速计算课程

  • 加速计算基础 —— CUDA C/C++

    预备知识: 基本的 C/C++ 编程能力,包括熟悉变量类型、循环、条件语句、函数和数组操作。无需具备前期 CUDA 编程知识。

    Assessment Type: Code-based

    课程时长: 8 小时

    语言: 中文

    价格: 90 美元

    提供认证证书:学习完成后,通过在线测试,系统将自动发送证书

    CUDA 计算平台能够加速仅适用于 CPU 的应用程序,以在世界上最快的大规模并行 GPU 上运行。 通过以下方式体验 C/C++应用加速:

    • 加速仅适用于 CPU 的应用程序在 GPU 上运行其潜在并行性
    • 利用基本的 CUDA 内存管理技术来优化加速应用程序
    • 揭示加速应用程序的并发潜力,并利用CUDA流进行开发
    • 利用命令行和可视化分析来指导和检查

    完成本课程后,您将能够使用最基本的 CUDA 工具和技术,加速和优化仅适用于 CPU 的 C/C++应用程序。您将了解 CUDA 开发的迭代风格,这将允许您快速发布加速应用程序。

  • 加速计算基础 —— CUDA Python

  • 加速计算基础 —— OpenACC

    预备知识: C/C++ 基础知识经验

    课程时长: 8 小时

    语言: 英文

    价格: 90 美元

    学习高级 GPU 编程语言 OpenACC 的基础知识。本课程适合具有部分 C/C++ 经验,且对加速应用程序性能以超越纯 CPU 编程极限感兴趣的任何人士。在本课程中,您将学习:

    • 使用 OpenACC 加速现有应用程序的简单四步骤
    • 如何配置和优化您的 OpenACC 代码库
    • 如何将 OpenACC 与 MPI 相结合,以在多 GPU 系统上编程

    完成本课程后,您将能够同时使用 OpenACC、CUDA-aware MPI 和 NVIDIA 配置工具,构建和优化多 GPU 集群上的加速异构应用程序。

  • 使用 CUDA C/C++ 加速应用程序

    预备知识: C/C++ 基础知识经验

    课程时长: 2 小时

    语言: 中文

    价格: 30 美元

    CUDA 计算平台,能够让很多 CPU 程序并行化运行在 GPU 上,从而实现超乎想象的加速效果。本课程中,您将从以下几方面学习如何加速 C/C++ 应用程序:

    • 学习如何并行化 CPU 程序,重构并使之运行在 GPU 上
    • 学习如何调度存储空间来加速程序
    • 学些 CUDA 的线程层次,进一步提高程序的加速效果

    完成本课程后,您将能够利用 CUDA 优化自己的 C/C++ 程序,并获得巨大的性能提升。

  • OpenACC - 4个步骤实现2倍增速

    预备知识: C/C++ 基础知识

    课程时长: 2 小时

    语言: 英文

    价格: 30 美元

    了解如何使用 OpenACC 结合 NVIDIA GPU 的大规模并行计算能力,加速您的 C/C++ 或 Fortran 应用程序。OpenACC 是一种基于指令的计算方法,您只需要在代码中插入编译提示就可以加速您的程序,而不用自己编写加速代码。开始使用 OpenACC 加速应用程序的四步流程:

    • 描述并分析您的程序
    • 添加计算指令
    • 添加优化数据访存指令
    • 通过内核调度优化您的程序

    完成本课程后,您就可以使用 profile-driven 方法,快速地利用 OpenACC 指令加速您的 C/C++ 程序。

  • 使用 CUDA C/C++ 优化 GPU 内存

    预备知识: CUDA C/C++ 基础知识经验或类似经验

    课程时长: 2 小时

    语言: 英文

    价格: 30 美元

    探索在 NVIDIA GPU 上使用 CUDA C / C ++ 进行编程的内存优化技术,以及如何使用 NVIDIA Visual Profiler(NVVP)来支持这些优化。 您将学习如何:

    • 实践一个简单的矩阵转置算法
    • 使用 NVVP 执行几个算法分析周期并优化其性能

    完成本课程后,您将了解如何分析和改进全局和共享内存访问模式,以及如何优化 C / C ++ 的加速应用程序。

  • 使用 CUDA C/C++ 中的 GPU 加速库加速应用程序

    预备知识: 使用 CUDA C/C++ 加速应用程序” 课程或类似经验

    课程时长: 2 小时

    语言: 英文

    价格: 30 美元

    学习如何使用 CUDA 优化库加速您的 C/C++ 应用程序,从而实现对 NVIDIA GPU 大规模并行能力的利用。您将完成三个练习,包括如何:

    • 使用 cuBLAS 加速基本矩阵乘法
    • 通过向先前的 cuBLAS 调用添加一些 cuRAND API 调用来组合库
    • 使用 nvprof 分析代码并使用一些 CUDA Runtime API 调用进行优化

    完成本课程后,您将可以在现有的仅支持CPU的 C / C ++ 程序中,利用一些支持 CUDA 的库来加速应用程序。

  • 使用 Thrust 加速 C++

    预备知识: 使用 CUDA C/C++ 加速应用程序” 或类似经验

    课程时长: 2 小时

    语言: 英文

    价格: 30 美元

    Thrust 是一个基于C ++ 标准模板库的并行算法库。 它使开发人员能够快速拥有并行计算的强大功效,并支持多个系统后端,如 OpenMP 和英特尔的 Threading Building Blocks。 使用 Thrust 通过以下练习来加速 C ++:

    • 基本迭代器,容器和函数
    • 内置和自定义函数
    • CPU 处理的可移植性

    完成本课程后,您将可以使用功能强大的 Thrust 库来加速您的C / C ++ 应用程序。

合作伙伴的在线培训

DLI与教育机构合作,为全世界的开发者提供深度学习培训。

20 人或者更多的人员需要培训时,我们建议通过“讲师指导的培训班”来学习。学习如何将深度学习应用到实际的项目中,和如何用 CUDA 和 OpenACC 加速应用。通过在云端 GPU 平台上的动手实践培训,大家将能够获得可用于工作中的实用技能,并获得培训证书。此外,您也可以查看和参加即将公开举办的 DLI 讲师指导的培训班。

讲师指导的培训班

在您的企业组织内,DLI可以举办讲师指导的培训班,为开发者、数据科学家、研究人员和工程师团队提供现场培训。每个全天的培训班,都将由DLI认证讲师指导,包含讲座、在云端GPU服务器上动手实践,训练和部署端到端的应用项目,并获得培训证书。

提供认证证书

深度学习课程

深度学习——通用基础

  • 深度学习基础 —— 计算机视觉

    预备知识: 熟悉编程基础知识,如函数和变量

    框架: Caffe, DIGITS

    课程时长: 8小时

    语言: 中文

    提供认证证书:学习完成后,通过在线测试,系统将自动发送证书

    通过训练神经网络和利用训练成果提升性能和能力,探索深度学习的基础原理。 在本课程中,您将亲手训练和部署神经网络,从而了解深度学习的基础知识,将学习如何

    • 实践常规的深度学习工作流程,例如图像分类和目标检测
    • 用数据、训练参数、网络结构和其他策略进行试验,以便提升性能和能力
    • 部署您的神经网络来解决实际问题

    完成本课程后,您将能够利用深度学习来解决现实中的问题。

  • 深度学习基础 —— 多数据类型

    预备知识: 熟悉基本的 Python(函数和变量)知识和具有训练神经网络的经验

    框架: TensorFlow

    课程时长: 8小时

    语言: 英文, 中文, Japanese, Korean

    提供认证证书:学习完成后,通过在线测试,系统将自动发送证书

    本课程探讨如何结合卷积和递归神经网络,在图像和视频片段中生成有效的内容描述。 学习如何使用 TensorFlow 和 MSCOCO 数据集训练网络,通过以下方法从图像和视频中生成字幕:

    • 实践深度学习工作流程,例如图像分割和文本生成
    • 比较与对比数据类型、工作流程和框架
    • 将计算机视觉和自然语言处理结合运用

    完成本课程后,您将能够解决需要多种类型数据输入的深度学习问题。

  • 深度学习基础 —— 自然语言处理

    预备知识: 神经网络基础知识和经验

    框架: TensorFlow, Keras

    课程时长: 8小时

    语言: 中文

    提供培训证书:学习完成后,通过在线测试,系统将自动发送证书

    学习用自然语言处理(NLP)来理解文本输入的最新的深度学习技术。您将学习如何:

    • 将文本转换成机器可理解的表示和分类方法
    • 实践分布式表示(embedding)并理解其属性
    • 训练机器将一种语言翻译成另一种语言

    完成本课程后,您将能够熟练使用类似的应用程序进行自然语言处理。

  • 深度学习基础 —— 用多 GPU 训练神经网络

    预备知识: 具备随机梯度下降力学经验

    框架: TensorFlow

    课程时长: 8小时

    语言: 中文

    提供认证证书:学习完成后,通过在线测试,系统将自动发送证书

    在驱动自动驾驶汽车等 AI 应用方面,人们对于深度神经网络存在着巨大的计算需求。使用单个 GPU 进行的一个训练周期需耗费数周时间,而对于自动驾驶汽车研究等领域所用的更大数据集,该周期甚至长达数年。使用多个 GPU 进行深度学习能够显著缩短训练大量数据所需的时间,从而为深度学习中的复杂问题提供了可行的解决方案。

    本课程将教您如何使用多个 GPU 来训练神经网络。您将了解到:

    • 针对多 GPU 的训练方法
    • 进行大规模训练面临的算法和工程挑战
    • 克服上述挑战所用的关键技术

    完成本课程后,您将能够使用 TensorFlow 十分有效地并行训练深度神经网络。

深度学习——行业应用

  • 深度学习 —— 自动驾驶感知

    预备知识: CNN 基础知识经验

    框架: TensorFlow, DIGITS, TensorRT

    课程时长: 8小时

    语言: 中文

    提供认证证书:学习完成后,通过在线测试,系统将自动发送证书

    在本课程中,您将学习使用 NVIDIA DRIVE AGX 开发平台,设计、训练和部署用于自动驾驶的深度神经网络。将学习如何:

    • 了解 DRIVE AGX 以及如何基于其来开发软件
    • 训练语义分割神经网络
    • 如何在 DRIVE AGX上优化和和部署语义分割网络

    完成本课程后,您将能够使用 DRIVE AGX 创建和优化自动驾驶的感知组件。

  • 深度学习 —— 应用于工业检测

  • 深度学习 —— 智能视频分析

    预备知识: 深度网络(尤其是 CNN 变体)相关经验以及 C++ 和 python 中等编程经验

    框架: TensorFlow, TensorRT, Caffe

    课程时长: 8小时

    语言: 英文

    提供认证证书:学习完成后,通过在线测试,系统将自动发送证书

    每天,超过10亿台摄像机拍摄到了几乎世界各地的所有活动。 为了处理这些视频源,我们需要先进的技术将其转换为可执行的分析,涉及到识别,分类,分割,预测和推荐。您将学习如何:

    • 使用 TensorFlow 目标检测 API 训练和评估深度学习模型
    • 探索开发高质量神经网络模型所涉及的策略和权衡,以跟踪大规模视频数据集中的移动目标
    • 使用 TensorRT 优化实时应用的推理时间

    完成本课程后,您将能够部署目标检测和跟踪网络,以处理大规模的实时视频流。

  • 深度学习 —— 机器人

    预备知识: 基本熟悉深度神经网络,Python 或类似语言基础编程经验

    框架: DIGITS

    课程时长: 8小时

    语言: 英文

    提供认证证书:学习完成后,通过在线测试,系统将自动发送证书

    AI 为各种行业的机器人技术带来了变革性的加速和发展。本课程学习如何基于 NVIDIA Jetson 创建嵌入式应用的机器人解决方案。 您将学习如何:

    • 应用计算机视觉模型进行检测
    • 修剪和优化嵌入式应用程序的模型
    • 训练机器人根据视觉输入实现正确地输出

    完成本课程后,您将了解如何在机器人上部署高性能深度学习应用程序。

  • 深度学习 —— 使用自编码器创建数字内容

    预备知识: 熟悉深度学习基本概念(如 CNN)且有 Python 编程经验

    框架:TensorFlow, Torch

    课程时长: 8小时

    语言: 中文

    提供认证证书:学习完成后,通过在线测试,系统将自动发送证书

    探索用于数字内容创作的神经网络的设计、训练和部署的最新技术。您将学习:

    • 使用新的架构和技术来完成任意视频风格的转换
    • 训练降噪器来渲染图像
    • 以超分辨率技术来提高图像质量

    完成本课程后,您就可以开始使用深度学习方法来创建数字资产。

  • 深度学习 —— 医学影像分析

    预备知识: 基本熟悉深度神经网络、Python 或类似语言的基础编程经验

    框架: Caffe, DIGITS, R, MXNet, TensorFlow

    课程时长: 8小时

    语言: 中文

    提供认证证书:学习完成后,通过在线测试,系统将自动发送证书

    本动手实验课程将探讨如何在 MRI 扫描影像中应用卷积神经网络 (CNN) 执行各种医学任务和计算。您将学习如何:

    • 在 MRI 影像上进行图像分割来定位左心室
    • 使用应用于 MRI 扫描的 CNN 测量心脏舒张和收缩之间的压差来计算射血分数,从而检测心脏疾病
    • 在 MRI 扫描中应用 CNN 来检测 LGG 以确定 1p/19q 染色体的联合缺失状态

    完成本课程后,您将能够在 MRI 扫描中应用 CNN 执行不同的医疗医学任务。

加速计算课程

  • 加速计算基础 —— CUDA C/C++

    预备知识: 基本的 C/C++ 编程能力,包括熟悉变量类型、循环、条件语句、函数和数组操作。无需具备前期 CUDA 编程知识。

    课程时长: 8 小时

    语言: 中文

    提供认证证书:学习完成后,通过在线测试,系统将自动发送证书

    CUDA 计算平台能够加速仅适用于 CPU 的应用程序,以在世界上最快的大规模并行 GPU 上运行。 通过以下方式体验 C/C++应用加速:

    • 加速仅适用于 CPU 的应用程序在 GPU 上运行其潜在并行性
    • 利用基本的 CUDA 内存管理技术来优化加速应用程序
    • 揭示加速应用程序的并发潜力,并利用CUDA流进行开发
    • 利用命令行和可视化分析来指导和检查

    完成本课程后,您将能够使用最基本的 CUDA 工具和技术,加速和优化仅适用于 CPU 的 C/C++应用程序。您将了解 CUDA 开发的迭代风格,这将允许您快速发布加速应用程序。

  • 加速计算基础 —— CUDA Python

    预备知识: 基本的 Python 编程能力,包括熟悉变量类型、循环、条件语句、函数和数组操作。使用 NumPy 的能力,包括使用 ndarrays 和 ufuncs。

    课程时长: 8 小时

    语言: 英文

    提供认证证书:学习完成后,通过在线测试,系统将自动发送证书

    探讨如何使用 Numba(即时,专用类型的 Python 函数编译器)在 NVIDIA 大规模并行运算的 GPU 上加速 Python 应用程序。 将学习如何:

    • 使用 Numba 从NumPy ufuncs 编译 CUDA 内核
    • 使用 Numba 创建和启动自定义 CUDA 内核
    • 应用关键的GPU内存管理技术

    完成本课程后,您将能够使用Numba编译并启动 CUDA 内核,以加速 NVIDIA GPU上的 Python 应用程序。

企业解决方案

如果您正在寻找更全面的企业培训,DLI 企业解决方案提供了一整套培训和讲座,以满足您的企业的专属需求。从在线学习和在现场举办的动手实践培训、高管简报到企业级报告,DLI 将助力您的企业实现向 AI 的转型。联系我们了解更多。

大学老师可以申请成为 NVIDIA DLI 校园大使,为在校师生免费教授DLI培训班课程。还可以下载 NVIDIA 教学套件,轻松扩展您的大学课程素材,及免费获取 DLI 在线自主培训资源。

教学套件

DLI 教学套件为大学老师提供课程方案,包含深度学习、加速计算和机器人三个主题。您可以轻松地将讲课材料、实践课程和 GPU 云资源等整合到课程体系中。

校园大使

经过认证的大学老师将成为DLI校园大使,将可以面向在校师生免费使用 DLI 课程资源、教授 DLI培训。

DLI 校园大使已经遍布全球百余所大学,包含:

Arizona State University
Columbia
The Hong Kong University Of Science And Technology
Massachusetts Institute of Technology
NUS - National University of Singapore
University of Oxford
Arizona State University
Columbia
The Hong Kong University Of Science And Technology
Massachusetts Institute of Technology