NVIDIA 企业开发者社区在线研讨会主要面向GPU开发者,分享NVIDIA GPU 以及开发工具、AI框架或者平台等相关开发技术经验。
在线研讨会是以线上直播的方式呈现,往期研讨会内容已经被收录在此,内容涵盖 CUDA 开发及其他 NVIDIA 开发工具使用分享、AI 计算加速、GPU开发在一些具体应用场景的实现等内容。如果您对以上内容感兴趣,请点击 ”历史在线研讨会” 栏目下相应主题,提交注册信息后观看研讨会回放。
CUDA编程方法是目前广泛使用的并行化程序编程方法。在深度学习,计算机视觉,生物医疗,环境科学,气象预报,石油勘探等领域具有大量的使用场景。通过这堂课,您将学会:
受众目标:针对 GPU 平台程序有开发需求的开发者
时长: 1 小时
PPT 下载链接 (提取码 : wdhz)
链接: (提取码 : op40)
本次研讨会将深入的介绍如何利用共享内存和常量内存来加速GPU程序,通过本次研讨会,您将学会
受众目标:针对有 GPU 平台开发需求的开发者
PPT 下载链接 (提取码 : hqjp)
多流执行是 CUDA 编程模型中的重要加速手段,本次研讨会将深入的介绍如何利用多流执行来加速 GPU 程序,通过本次研讨会,您将学会:
PPT 下载链接 (提取码 : gf02)
NVIDIA cuBLAS 库是标准基本线性代数子程序( Basic Linear Algebra Subroutines)的 GPU 加速库. 使用cuBLAS API,您可以通过将密集型计算部署到单个 GPU 来加速应用程序,或者有效地扩展和分配到多GPU配置的服务器上,通过本次研讨会,您将学到
PPT 下载链接 (提取码 : k1g1)
在这门课中,您将学会如何从头开始配置一台 GPU AI 服务器,我们会结合硬件系统和软件系统介绍完整的解决方案。内容包括:
PPT 下载链接 (提取码 : krf5)
受众目标:针对有图像处理和机器视觉知识背景的人员
时长: 1.5 小时
PPT 下载链接 (提取码 : 2abe)
此研讨会将会介绍如何利用 TensorRT 加速 YOLO 目标检测,研讨会将会着重介绍编程方法。本次研讨会还会涉及到 TensorRT 中数据类型,流处理,多精度推理等细节的展示
受众目标:对于 TensorRT 有一定基础的开发人员
PPT 下载链接 (提取码 : 8x5w)
本次在研讨会针对有模型训练知识背景的技术人员,将会介绍 TensorRT 6.0 的最新特性,以及如何利用CUDA和cuDNN创建新的组件。
PPT 下载链接 (提取码 : 0taa)
本次在研讨会针对有模型训练知识背景的技术人员,将会介绍 TensorRT的最新特性,以及 Deepstream 的使用方法。
PPT 下载链接 (提取码 : c1id)
将介绍如何针对不同的传感器类型(如雷达,激光雷达和摄像头)安装及启用传感器插件。这些插件使开发人员可以将新的传感器加到DriveWorks 传感器抽象层(SAL)中,以实现与传感器交流所需的传输和协议层。了解更多如何将新的传感器集成到 DriveWorks 软件开发套件(SDK)中以及关于 NVIDIA DRIVE AGX 的更多信息。
介绍了 CUDA 并行计算编程模型和 TensorRT 高性能深度学习推理平台。.基于 CUDA 构建的 TensorRT 使开发人员能够导入、校准、生成和部署优化网络。 以及如何使用插件界面通过 TensorRT 运行自定义层,为了最快地实现自定义层,使用相同的 GPU 构建运行优化核心的 CUDA 程序。以及如何通过示例应用程序将 CUDA 核心程序作为 TensorRT 插件的一部分,以用于 DNN 模型的优化。
自动驾驶汽车依靠摄像头来“看见”周围世界。要实现没有人类驾驶员参与的安全驾驶,自动驾驶汽车必须能够快速准确地处理来自摄像头的图像数据。NVIDIA DriveWorks 软件开发套件(SDK)提供了一个高效模块化的功能库,可用于开发摄像头图像处理软件。NVIDIA DriveWorks强大的图像数据处理能力,为开发者在开发更高级的自动驾驶软件时提供了坚实的基础。 将会讲解在 NVIDIA DriveWorks 软件开发套件(SDK)上开发摄像头图像处理软件的步骤。借助该平台,开发者们可以无缝添加一系列高性能的功能。本次研讨会的内容还包括 DriveWorks 图像基础,低阶计算机视觉模块,特征追踪以及深度神经网络(DNN)示例。
本次研讨会将会就探讨自动驾驶机器人 Jetbot 的软硬件搭建,功能实现以及深度学习部署和优化的方案。在这次活动中,将会从多个角度全面地介绍如何快速的搭建一个完整的智能小车方案
受众目标:对于 Python 有一定基础的开发人员
PPT 下载链接 (提取码 : k2g9)
PPT 下载链接 (提取码 : nz5p)
NVIDIA TAO Toolkit 是一个基于 python 的工具包,它使开发人员能够使用 NVIDIA 预先训练好的模型,并让开发人员能够使用流行的网络架构适配他们自己的数据来训练、调整、修剪和导出以进行部署。它拥有简单的接口和抽象,提高了深度学习训练工作流程的效率
受众目标:针对人工智能和深度学习的开发者
PPT 下载链接 (提取码 : gqh3)
A Style-Based Generator Architecture for Generative Adversarial Networks 是 NVIDIA 在 2018 年发布的一个新的生成对抗网络方法。StyleGAN是一步一步地生成人工的图像,从非常低的分辨率开始,一直到高分辨率(1024×1024)。通过分别地修改网络中每个级别的输入,它可以控制在该级别中所表示的视觉特征,从粗糙的特征(姿势、面部形状)到精细的细节(头发颜色),而不会影响其它的级别。此研讨会将会介绍 Style-Gan 的基本框架和原理,并具体介绍模型的训练,以及训练好模型的应用,包括:
受众目标:针对有模型训练知识背景的技术人员
PPT 下载链接 (提取码 : pms7)
本视频介绍了如何在 NVIDIA Jetson NANO 上快速的搭建部署一个目标检测任务,并调用安装好的工具包利用十行代码完成目标检测
受众目标:有深度学习经验的开发者
时长: 40 分钟
会话式AI是利用机器学习开发基于语言的应用程序,使人类能够通过语音与设备、机器和计算机进行自然互动。 当您的虚拟助理智能语音助手,在早上叫醒您、在上下班途中询问方向、或者在网上购物时与聊天机器人交流。您可以使用会话人工智能用您正常的声音说话,这个设备就能理解,并找到最好的答案,然后用听起来很自然的声音进行回答。
NeMo是一个用于构建新型最先进的对话AI模型的工具箱,NeMo有独立的集合用于自动语音识别(ASR)、自然语言处理(NLP)和文本到语音(TTS)模型。
本次网络研讨会面向的是会对话AI感兴趣的开发人员。
通过本次研讨会,您可以获得以下信息:
智能问答系统是自然语言处理领域的重要任务之一, 它是对无序语料信息进行有序、科学的整理,建立基于知识的分类模型; 这些模型可以指导新添加的分类语料库和服务信息,节省人力资源,提高信息处理的自动化程度。 它具有广泛的应用如:智能语音交互、在线客服、知识获取、个性化情感聊天等。
NeMo是一个用于构建新型最先进的对话AI模型的工具箱, NeMo有独立的集合用于自动语音识别(ASR)、自然语言处理(NLP)和文本到语音(TTS)模型。
本次网络研讨会面向的是对会话AI感兴趣的开发人员。
网络研讨会1:
主题:使用NeMo快速完成文本分类任务
时间:2021年8月12日,星期三,晚上8点至9点30分,晚上7点30分,讲师登录
持续时间:1.5小时
课程描述:
文本分类是自然语言处理领域的子任务之一。 它是指将包含信息的文本通过计算机映射到指定类别或若干类别的主题的过程。文本分类的应用场景包括:新闻主题分类(文章分类)、情感分析、舆情分析、邮件过滤等。 NeMo是一个用于构建先进的对话AI模型的工具库,NeMo有独立的集合用于自动语音识别(ASR)、自然语言处理(NLP)和文本到语音(TTS)模型。
本次网络研讨会面向的是对会话式AI感兴趣的开发人员。
NVIDIA CUDA Toolkit提供了一个开发环境,用于创建高性能GPU加速应用程序。通过CUDA Toolkit,您可以在GPU加速的嵌入式系统、桌面工作站、企业数据中心、基于云的平台和HPC超级计算机上开发、优化和部署应用程序.
CUDA编程模型已经广泛地应用于人工智能领域。由于GPU硬件结构的特性,使得它能够为AI提供强大的计算力的支持。卷积操作在很多网络模型中都被广泛使用,了解CUDA如何帮助卷积操作加速,将会帮助您在AI领域事半功倍。本次课程将介绍,如何利用CUDA及相关加速库实现卷积操作。
本次课程针对需要进行HPC和AI的开发者。通过本次课程,您可以了解到以下内容:
CUDA编程模型已经广泛地应用于在计算机视觉领域。特别是在数字内容创建,图像渲染和模拟等行业GPU提供了强大的计算能力。本次课程将介绍GPU多种存储单元的先进性,并利用它们的特点来优化程序。
CUDA编程模型已经广泛地应用于在计算机视觉领域,对图像的预处理已经成为很多领域必不可少的一步。本节课程将会以图像处理为实例来介绍如何利用CUDA加速应用程序
受今年新冠疫情的影响,快速的口罩检测成为了目前一个比较火热的话题。在不同的场景下,快速训练并部署一个属于自己的口罩检测模型成为了搭建高效防疫机制的关键。 本次课程将介绍如何利用 NVIDIA TAO 工具包,在 Python 的环境下快速训练并部署一个口罩监测模型。并会详细介绍,如何利用该工具,对模型进行剪枝,评估并优化。TAO 工具包 内包含了 95 个预训练模型,6 个常用网络模型,用户不用从头开始训练,极大地减轻了准备样本的工作量,让开发者专注于模型的精度提升。 TAO 工具包 是一个基于 Python 的工具包,它使开发人员能够利用 NVIDIA 预先训练的模型,并为开发人员提供一系列的工具,使流行的网络架构适应他们自己的数据,并且能够训练、调整、修剪和导出模型以进行部署。它还拥有简单的接口和抽象 API,提高了深度学习训练工作流的效率。 本次在线研讨会主要面向有高性能计算和人工智能开发需求的开发者,通过本次在线研讨会,您可以获得以下内容:
下载 PPT
CUDA 编程方法是目前广泛使用的并行化程序编程方法。在深度学习,计算机视觉,生物医疗,环境科学,气象预报,石油勘探等领域具有大量的使用场景。Numba 是一个支持 Python CUDA 的编译器,它为 Python 开发人员提供了一个简单的进入 GPU 加速计算的入口,用最简单的方式加速您的应用。 本次在线研讨会主要针对有高性能计算和人工智能开发需求的开发者,通过本次在线研讨会,您可以获得以下内容:
NVIDIA TAO 工具包是一个基于python的工具包,它使开发人员能够使用NVIDIA预先训练好的模型,并让开发人员能够使用流行的网络架构适配他们自己的数据来训练、调整、修剪和导出模型以进行部署。它拥有简单的接口和抽象,提高了深度学习训练工作流程的效率。 本次在线研讨会主要针对人工智能和深度学习的开发者,介绍如何快速部署一个Jetbot智能小车,并将NVIDIA TAO 工具包构建的引擎部署在Jetbot上。 通过本次在线研讨会,您可以获得以下内容:
本次课程将深入的介绍如何利用共享内存和常量内存来加速GPU程序,通过本次课程,您将学会
多流执行是 CUDA 编程模型中的重要加速手段,本次课程将深入的介绍如何利用多流执行来加速 GPU 程序,通过本次课程,您将学会:
NVIDIA cuBLAS 库是标准基本线性代数子程序( Basic Linear Algebra Subroutines)的 GPU 加速库. 使用cuBLAS API,您可以通过将密集型计算部署到单个 GPU 来加速应用程序,或者有效地扩展和分配到多GPU配置的服务器上,通过本次课程,您将学到
此课程将会介绍如何利用 TensorRT 加速 YOLO 目标检测,课程将会着重介绍编程方法。本次课程还会涉及到 TensorRT 中数据类型,流处理,多精度推理等细节的展示
本次在课程针对有模型训练知识背景的技术人员,将会介绍 TensorRT 6.0 的最新特性,以及如何利用CUDA和cuDNN创建新的组件。
本次在课程针对有模型训练知识背景的技术人员,将会介绍 TensorRT的最新特性,以及 Deepstream 的使用方法。
本次课程将会就探讨自动驾驶机器人 Jetbot 的软硬件搭建,功能实现以及深度学习部署和优化的方案。在这次活动中,将会从多个角度全面地介绍如何快速的搭建一个完整的智能小车方案
NVIDIA TAO 工具包 是一个基于 python 的工具包,它使开发人员能够使用 NVIDIA 预先训练好的模型,并让开发人员能够使用流行的网络架构适配他们自己的数据来训练、调整、修剪和导出以进行部署。它拥有简单的接口和抽象,提高了深度学习训练工作流程的效率
A Style-Based Generator Architecture for Generative Adversarial Networks 是 NVIDIA 在 2018 年发布的一个新的生成对抗网络方法。StyleGAN是一步一步地生成人工的图像,从非常低的分辨率开始,一直到高分辨率(1024×1024)。通过分别地修改网络中每个级别的输入,它可以控制在该级别中所表示的视觉特征,从粗糙的特征(姿势、面部形状)到精细的细节(头发颜色),而不会影响其它的级别。此课程将会介绍 Style-Gan 的基本框架和原理,并具体介绍模型的训练,以及训练好模型的应用,包括:
受众目标: