真实应用场景、实时GPU开发环境、全球培训证书
NVIDIA 深度学习学院 (DLI) 提供 AI 、加速计算和加速数据科学方面的应用开发实战培训,以期解决实际应用方面的问题。基于云端完全配置的 GPU 平台,开发者、数据科学家、研究人员和院校师生可以快速获取和提升实践经验。IT 专业人员可以学习如何设计和管理基础架构,来支持企业内 AI、数据科学和高性能计算 (HPC) 工作负载。 NVIDIA DLI 配有全球统一的开发者培训证书,可以为您的职业发展提供有力证明。
个人学习可以从“在线自主培训”开始。团体或企业培训可以从“讲师指导的培训班”开始学习。DLI 同时为高校师生提供更多的培训资源和支持。
DLI 课程可以长期、多次、反复学习和实验。
对于个人、或少数人员规模的团队,可以从在线自主培训开始学习。通过在云端GPU平台上的动手实践培训,您将能够获得可用于工作中的实用技能,并获得培训证书。此外,您还可以查看和参加即将公开举办的DLI讲师指导的培训班。
随时随地访问完全配置的GPU云服务器、按照课件中的详细指导进行自主学习和动手实践。您可以选择8小时的课程来实施和部署端到端的应用项目,或者选择2小时的课程来学习特定技术的应用。大多数8小时的课程含有培训证书,可以助力您的职业发展。
如果您刚开始接触深度学习,请从通用基础课程开始,学习如何训练和部署神经网络来解决实际问题。掌握这些深度学习的基本知识和经验,将有助于您学习更高阶、特定行业应用的 DLI 培训。
预备知识: 熟悉编程基础知识,如函数和变量
框架: Caffe,DIGITS
Assessment Type: Code-based
课程时长: 8 小时
语言: 中文
价格: 90 美元(可用“支付宝” 支付人民币)
提供认证证书:学习完成后,通过在线测试,系统将自动发送证书
通过训练神经网络和利用训练成果提升性能和能力,探索深度学习的基础原理。
在本课程中,您将亲手训练和部署神经网络,从而了解深度学习的基础知识,将学习如何:
完成本课程后,您将能够利用深度学习来解决现实中的问题。
预备知识: 基本了解 Python(有帮助但非必须条件)
工具、库、框架: PyTorch,Jetson Nano
课程时长: 8 小时
价格: 免费
提供认证证书:学习完成后,通过在线测试,系统将自动发放证书
您想开发AI应用,但还不知道怎么做么?其实,这可以比您想象的要更加容易。无论是专业人士、研究人员还是学生和AI爱好者,NVIDIA 都可以提供不同的工具、灵感和指导。
Jetson Nano Developer Kit —— 这是一款易于使用且功能强大的迷你AI计算机,能够同时并行运行多个神经网络应用,例如图像分类,目标检测,分割和自然语言处理等。在本课程中,您将使用Jupyter iPython notebook,在自己的 Jetson Nano 上基于机器视觉模型来构建深度学习分类应用。
您将学习如何:
完成后,您将能够在 Jetson Nano 上创建自己的深度学习分类和回归模型。
所需的硬件:
预备知识: TensorFlow 和 Python 应用经验
框架: TensorFlow, Python, TensorRT (TF-TRT)
课程时长: 2 小时
价格: 30 美元(可用“支付宝” 支付人民币)
学习使用内置TensorRT库(TF-TRT)和Python在TensorFlow平台中生成高性能深度学习模型的基础知识
将探索:
完成本课程之后,您将了解如何利用 TF-TRT 来实现可部署的优化模型。
预备知识:Python 编程能力和在 Python 中训练深度学习模型的专业经验
工具、库、框架: Horovod, TensorFlow2, Keras
框架: TensorFlow
语言: 英文
价格: 30 美元
现代深度学习方法采用了规模越来越大的数据集和日益复杂的模型。 这使得要想有效、快速地训练模型就需要超级强大的计算能力。 在本课程中,您将学习如何使用Horovod(由Uber最初构建的开源分布式训练框架)将深度学习训练扩展到多个GPU。 您将学到:
完成本课程后,您将能够使用Horovod在新的或现有的代码库中有效地扩展深度学习的模型训练。
预备知识: 神经网络基础知识经验
图像(或语义)分割是将图像的每个像素放置到特定类中的任务。学习如何用核磁共振成像来测量心脏的部分:
完成本课程后,您将能够使用深度学习来建立大多数计算机视觉工作流程。
预备知识: Python 使用经验,并基本熟悉神经网络
工具、库和框架 Python, pandas, Keras
递归神经网络(RNNs)允许模型对诸如自然语言、市场信息,或病人的长期健康等时间序列数据做分类或预测。在本课程中,您将用重症监护记录的数据来构建一个RNN模型,该模型提供实时的生存概率预测,以帮助医护人员做出重症监护治疗决策。您将学到:
完成本课程后,您可以使用RNN来构建用于时间序列数据的模型。
预备知识: Python 使用经验
工具、技术和框架: PyTorch, Python
语言: 英文, 中文
价格: 30 美元(可用“支付宝”支付人民币)
探索如何将深度学习应用于放射学和医学影像领域。 在本课程中,您将学习如何:
完成本课程后,您将能够应用 CNN 对医学影像数据集进行图像分类。
预备知识: CNN 和 Python 基础知识
在梅奥医院应用这项技术后,我们发现使用深度学习技术从 MRI 影像中检测放射组的方法已经为脑瘤患者提供了更有效的治疗,并改善了他们的健康状况。通过以下方法学习检测 1p19q 联合缺失生物标记:
完成本课程后,您将能够以独特视角去看待使用深度学习预测影像组所带来的全新卓越成效。
预备知识: CNN 基础知识经验
生成式对抗网络 (GAN) 是一对深度神经网络,包括一个可基于所给数据创建新示例的生成器和一个试图区分真实数据与模拟数据的判别器。由于这两种网络互相促进,因而创建的示例会越来越真实。这项技术在医疗保健领域具有十分广阔的应用前景,因为它可以扩大较小的数据集,以便训练传统网络。您将学习如何:
完成本课程后,您将能够在医学成像用例中应用 GAN。
由粗到细的上下文记忆 (CFCM) 是一项专为图像分割开发的技术,该技术采用极深的网络架构,并能通过卷积长短期记忆 (LSTM) 机制集成多种不同尺度的特征。您将能够:
完成本课程后,您将能够在医学影像分割和类似的成像任务中应用 CFCM 技术。
预备知识:使用 C++ 和 Gstreamer 的经验
框架:DeepStream3
DeepStream 3.0框架具有独特的智能视频分析应用的硬件加速构建模块,开发人员从而可以专注于构建核心的深度学习网络。 DeepStream SDK支持各种应用场景,并在部署介质上具备很强的灵活性。您将学习如何:
完成本课程后,您将了解如何使用DeepStream创建基于AI的视频分析应用程序,以将视频流转换为可用 的洞察。
预备知识: 熟悉 C
技术:DeepStream, TensorRT, Jetson Nano
无论是用于识别自家的猫,还是优化顾客的购物体验,基于人工智能的视频理解可以带来深刻洞察力。NVIDIA Jetson Nano开发套件,这个易于使用且功能强大的计算机,可以并行运行多个神经网络。对于应用 NVIDIA DeepStream软件开发工具进行智能视频分析应用开发,Jetson Nano是一个很棒的平台。 在本课程中,您将在Jetson Nano上使用JupyterLab notebooks来构建项目,通过深度学习视频分析从视频流中提取有意义的见解。 您将学习如何:
完成本课程后,您将能够构建一个 DeepStream 应用程序来识别和分类汽车,并在拥挤的场景中统计人数。
可选的硬件
预备知识: 基本的 C/C++ 编程能力,包括熟悉变量类型、循环、条件语句、函数和数组操作。无需具备前期 CUDA 编程知识。
价格: 90 美元(可用“支付宝”支付人民币)
了解如何使用最基本的 CUDA 技术和 Nsight Systems 分析器加速和优化现有的仅靠 CPU 驱动的 C/C++ 应用程序,以利用 GPU 的强大功能。
完成本课程后,您将能够使用最基本的 CUDA 工具和技术,加速和优化仅适用于 CPU 的 C/C++应用程序。您将了解 CUDA 开发的迭代风格,这将允许您快速发布加速应用程序。
预备知识: 基本的 Python 编程能力,包括熟悉变量类型、循环、条件语句、函数和数组操作。使用 NumPy 的能力,包括使用 ndarrays 和 ufuncs。
探讨如何使用 Numba(即时,专用类型的Python函数编译器)在 NVIDIA 大规模并行运算的 GPU 上加速 Python 应用程序。 将学习如何:
完成本课程后,您将能够使用 Numba 编译并启动 CUDA 内核,以加速 NVIDIA GPU 上的 Python 应用程序。
学习构建可以利用单个节点上所有可用 GPU 的可靠且高效的 CUDA C++ 应用程序。
学习构建可靠高效的 CUDA C ++ 应用程序,以利用复制/计算重叠执行来显著提高性能。
预备知识: C/C++ 基础知识经验
价格: 90 美元
学习高级 GPU 编程语言 OpenACC 的基础知识。本课程适合具有部分 C/C++ 经验,且对加速应用程序性能以超越纯 CPU 编程极限感兴趣的任何人士。在本课程中,您将学习:
完成本课程后,您将能够同时使用 OpenACC、CUDA-aware MPI 和 NVIDIA 配置工具,构建和优化多 GPU 集群上的加速异构应用程序。
预备知识:熟练使用C / C ++编程,和专业的HPC应用开发经验
工具、库、框架: Docker, Singularity, HPC Container Maker (HPCCM)
语言:英文
学习使用容器化环境开发高性能计算(HPC)应用程序,降低代码的复杂性和可移植性,从而提高开发效率。您将:
完成本课程后,您将能够快速构建和使用Docker,Singularity容器和HPCCM,以便在您的HPC应用程序中实现可移植的裸机性能。
预备知识: C/C++ 基础知识
了解如何使用 OpenACC 结合 NVIDIA GPU 的大规模并行计算能力,加速您的 C/C++ 或 Fortran 应用程序。OpenACC 是一种基于指令的计算方法,您只需要在代码中插入编译提示就可以加速您的程序,而不用自己编写加速代码。开始使用 OpenACC 加速应用程序的四步流程:
完成本课程后,您就可以使用 profile-driven 方法,快速地利用 OpenACC 指令加速您的 C/C++ 程序。
预备知识: Python 使用经验,包含 Pandas 和 NumPy
学习如何使用 RAPIDS 在大型数据集上执行多个分析任务,RAPIDS 是一套数据科学库,能够对数据科学工作流进行端到端的 GPU 加速。在本次课程中,您将学习:
完成本课程后,您将能够比以前更快地加载、操作和分析数量级的数据,支持更多的迭代周期,并极大地提高生产率。
预备知识:具有 Pandas、NumPy 和 scikit-learn 高阶技能
框架: 无
通过开源 RAPIDS 项目,数据科学家可以用 GPU 对他们的数据科学和分析应用实现端到端的加速,突破传统的仅基于 CPU 工作流的技术限制,并可以实现巨大的性能提升。通过以下课程,学习如何用GPU加速数据科学应用程序:
完成本课程后,您将能够重构现有的仅基于 CPU 的数据科学工作负载以实现在 GPU 上更快运行,并从零开始编写加速的数据科学工作流程。
预备知识:基本的网络、存储和数据中心运营知识
相关技术:人工智能、机器学习、深度学习、GPU硬件和软件
课程时长: 4 小时
价格:30 美元
本课程为传统IT人员打造,将探索 AI、GPU 计算、NVIDIA AI 软件体系结构,以及如何在数据中心实现和扩展 AI 工作负载。您将学习:
完成本课程后,您将了解AI如何改变社会,以及如何将 GPU 计算部署到数据中心以实现这种转型。
DLI与教育机构合作,为全世界的开发者提供深度学习培训。
对于一定人员规模的团队、或者希望获取讲师指导的个人,我们推荐您参加由DLI认证讲师教授的培训班。可以选择为您的成员单独开设实时在现场或者在线上的培训班,参加 NVIDIA 年度GTC 大会期间的DLI培训,或者加入由 NVIDIA DLI 认证合作伙伴组织的培训班。通过在云端完全配置的GPU服务器上完成实战型学习,您将能够获得工作或项目中所需的实用技能,并得到 NVIDIA 全球开发者培训证书。
预备知识: 理解 Python 中的基础编程概念,如函数、循环、字典和数组
工具、库和框架: Tensorflow、Keras、Pandas、Numpy
课程时长: 8小时
培训证书:包含
全球企业正在应用人工智能 (AI) 解决所面临的巨大挑战。医疗专业人员应用 AI 为病人提供更准确、更快速的诊断。零售企业应用 AI 提供个性化的客户购物体验。汽车制造商应用 AI 让私家车、共享出行和运输服务更加安全和高效。深度学习技术,通过多层人工神经网络精准地完成目标检测、语音识别和语言翻译等任务,是实现 AI 的强效方法。即便是那些让软件编写专家都觉得过于复杂和无从下手的数据,计算机都可以通过深度学习方法来从这些数据中学习和识别模式。
在此课程中,通过动手实践练习,您将学到深度学习在计算机视觉和自然语言处理中的工作原理。您将从零开始训练深度学习模型,运用相关工具和技巧,来获得高精确度的结果。您还将学习使用免费的、先进的经过训练的模型,来大幅节省时间,快速实现深度学习应用。
学习此课程,您将能够:
预备知识: 具有 Python 中级知识基础,包括了解 list comprehension,具备使用 Python 的数据科学经验,熟悉 NumPy 和矩阵数学
工具、库和框架: CuDF 、 CuPy 、 TensorFlow 2 和 NVIDIA Triton™ 推理服务器
在零售、娱乐、医疗、金融和其他诸多行业中,基于深度学习的推荐系统是实现个性化在线体验和有效决策的秘诀。
推荐系统的运作方式在于通过理解众多人之前的决定和其他特征,来找出用户偏好。例如,推荐系统可以根据用户的实际观影记录以及能够看懂的语种,帮助流媒体服务商了解用户偏好的电影类型。训练神经网络来泛化海量数据,快速为类似的用户和情景提供具体的建议,需要进行大量的计算。使用 GPU 可显著加速这一过程。如果企业希望提供更好的用户体验、与客户进行更深入的沟通互动,以及进行更明智的决策,则可以通过使用合理设计和训练的推荐系统来实现巨大的价值。
此课程涵盖构建高效推荐系统所需的基础工具和技巧,以及如何为实时推荐系统部署 GPU 加速的解决方案。
预备知识: 具备 Python 编码和使用库函数与参数的经验,具备对深度学习框架(如 TensorFlow、PyTorch 或 Keras)的基本理解,具备对神经网络的基本了解
工具、库和框架: PyTorch, pandas, NVIDIA NeMo™, NVIDIA Triton™ 推理服务器
培训证书: 包含
在过去的十年中,自然语言处理(NLP)的应用爆炸式增长。随着人工智能助手的大量出现,以及企业将更多的人机交互体验融入到业务中,理解如何使用 NLP 技术来操作、分析和生成基于文本的数据是至关重要的。现代技术可以像人类一样,捕捉语言的细微差别、使用情境和复杂程度。如果设计正确得当,开发人员可以使用这些技术来构建强大的 NLP 应用,在聊天机器人、AI 语音代理等众多程序中实现自然顺畅的人机交互。
深度学习模型在 NLP 中得到了广泛的应用,因为它们能够对众多语境和语言进行准确的概括。基于Transformer的模型,比如BERT(Bidirectional Encoder Representations from Transformers),在问答系统的SQuAD指标、实体识别、意图识别、情感分析等方面实现了与人类基准相媲美的准确率,推动了NLP产生革命性的进展。NVIDIA 提供的软件和硬件可帮助您快速构建卓越的 NLP 模型。您可以通过混合精度训练将训练过程加速至 4.5 倍,并可在不影响准确性的情况下,轻松将性能扩展到跨多个服务器节点的多个 GPU 上。
在此课程中,您将学习如何使用基于 Transformer 的自然语言处理模型完成文本分类任务(如文档归类)和命名实体识别 (NER) 任务,以及如何分析各种模型特性、限制和特点,从而基于衡量标准和应用领域来为特定用例选定最适合的模型。
预备知识: 具有训练梯度下降模型的经验
技术: Tensorflow,Keras, Horovod
在驱动自动驾驶汽车等 AI 应用方面,人们对于深度神经网络存在着巨大的计算需求。使用单个 GPU 进行的一个训练周期需耗费数周时间,而对于自动驾驶汽车研究等领域所用的更大数据集,该周期甚至长达数年。使用多个 GPU 进行深度学习能够显著缩短训练大量数据所需的时间,从而为深度学习中的复杂问题提供了可行的解决方案。
本课程将教您如何使用多个 GPU 来训练神经网络。您将了解到:
完成本课程后,您将能够使用 TensorFlow 十分有效地并行训练深度神经网络。
预备知识:熟悉 C++ and Python, 应用卷积神经网络(CNN)的经验
框架:TensorFlow, Keras, TensorRT, CUDA C++, Python, DIGITS
在本课程中,您将学习如何使用 NVIDIA DRIVE AGX 开发平台为自动驾驶汽车设计、训练和部署深度神经网络。您将学习:
完成本课程后,您将能够使用 DRIVE AGX 创建和优化自动驾驶的感知组件。
预备知识: 基本熟悉深度神经网络,拥有 Python 或类似语言的基本编程经验
框架: DIGITS
AI 正在革新机器人在各行各业中的加速和开发。探索如何利用 Jetson 为嵌入式应用程序创建机器人解决方案。
参加完本研讨会后,您将了解如何为机器人部署高性能深度学习应用程序。
预备知识: 具有使用Python的专业数据科学经验,训练深度神经网络的经验。
技术:NVIDIA RAPIDS™, XGBoost, TensorFlow, Keras, pandas, 自编码器, GANs, 机器学习, 人工智能
框架:RAPIDS,Keras, GANs, XGBoost
当您的企业需要监控网络安全威胁、欺诈性财务交易、产品缺陷或者设备健康状况时,人工智能(AI)可以帮助在这些异常状况影响您的业务之前,从数据中捕获它们。 本课程以电信行业为例。全球电信基础架构中运行着大量的信息,成为人类有史以来构建的最复杂、最动态的系统之一。您将学习如何应用多种基于AI的方法来解决一个特定的问题,即识别对电信网络的入侵。您将学到:
完成本课程后,您将能够使用监督和非监督机器学习在大型数据集中检测异常,进而将基于 AI 的异常检测方法,用于电信、网络安全、金融、制造业和其他诸多行业。
预备知识: 具有Python经验, 基本了解数据处理和深度学习。
技术: Python, TensorFlow, Keras, XGBoost, NVIDIA RAPIDS™, cuDF, LSTM, 自编码器, 人工智能, 深度学习
学习如何在时间序列数据中识别异常和故障,预估相应部分的剩余使用寿命,并用这些信息来将不同的异常情况匹配到具体的失效状态,从而实现预见性维护。在本课程中,您将学习:
完成本课程后,您将能够使用监督和非监督机器学习在大型数据集中检测异常。
预备知识:熟悉 Python 和卷积神经网络(CNNs)
工具、库、框架:TensorFlow, NVIDIA TensorRT™, Keras
评估类型: 基于代码
语言:中文
提供培训证书: 学习完成后,通过在线测试,系统将自动发送证书
探索如何使用来自生产线的真实的数据集构建深度学习模型,用于自动检测印刷电路板(PCB)上的电容器。 这可以帮助制造业降低检测成本并提高生产效率。 您将学习如何:
完成本课程后,您将能够设计、训练、测试和部署通过硬件加速的工业检测模型。