This site requires Javascript in order to view all its content. Please enable Javascript in order to access all the functionality of this web site. Here are the instructions how to enable JavaScript in your web browser.

讲师指导的培训班
模型并行 —— 构建和部署大型
神经网络

报名 AI 培训班

报名 AI 培训班

咨询和购买企业专属培训

超大型的深度神经网络 (DNN)，无论是用于自然语言处理 (如 GPT)、计算机视觉 (如规模巨大的视觉 Transformer)，还是语音 AI (如 Wave2Vec 2)，都具有区别于其较小规模同类模型的特殊属性。基于海量数据集训练出来的 DNN 的规模越来越大，使得它们只需再经过少量示例训练就能够适应新任务要求，从而加快了向通用人工智能的迈进。使用庞大的数据集，训练包含数百亿到千亿参数的模型并非易事，这需要独特的方法来综合运用人工智能、高性能计算 (HPC) 和系统知识。本课程的目标就是学习如何训练超大型的神经网络并将其部署到生产中。

学习目标

完成本课程后，您将能够：

跨多个服务器训练神经网络
使用激活检查点、梯度累积和各种形式的模型并行等技术，来克服与大型模型内存占用相关的挑战
捕获并了解训练性能特征以优化模型架构
使用 NVIDIA TensorRT-LLM 将超大型多 GPU 模型部署到生产环境

下载课程大纲 (PDF 518 KB)

课程大纲

议题	说明
课程介绍（15 分钟）	讲师介绍登陆 DLI 学习平台
训练大模型（120 分钟）	了解训练大型模型的需求和主要挑战了解训练大规模所需的基本技术和工具了解分布式训练和 Slurm 作业调度程序使用数据并行训练 GPT 模型分析训练过程并理解执行的性能
休息（60 分钟）
模型并行高级技能（120 分钟）	使用一系列节省内存的技术来增加模型规模了解 tensor 和并行工作流超越自然语言处理，了解 DeepSpeed 自动调整模型性能了解混合专家（MoE）模型
休息（15 分钟）
大模型推理（120 分钟）	理解与大型模型相关的部署挑战探索模型缩减技术学习使用 TensorRT-LLM 学习使用 Triton 推理服务器理解将 GPT 检查点部署到生产环境的过程查看提示工程的示例
总结（30 分钟）	回顾今日所学完成评估测试和获取证书填写反馈表了解如何设置您自己的 AI 应用开发环境
下一步	继续学习更多 DLI 课程：《数据并行 —— 用多 GPU 训练神经网络》《构建基于 Transformer 的自然语言处理应用》《构建大语言模型 RAG 智能体》

培训详情

课程时长：8 小时，课后 6 个月内可以继续访问课件（实验资源用量有限额）

课程模式：讲师实时授课，每位学员可使用云端完全配置的加速工作站实验练习

价格：

AI 培训班：每人 3500 元（提供发票）
企业专属培训：联系我们，微信添加 NVIDIALearn

预备知识：

熟悉 PyTorch
熟悉深度学习和数据并行训练概念
先学习过《数据并行 —— 用多 GPU 训练神经网络》和《构建基于 Transformer 的自然语言处理应用》课程会很有帮助（可选）

使用的工具、库和框架：PyTorch, NeMo Framework, DeepSpeed, Slurm, TensorRT-LLM

课程测评问题类型：

回答与课程内容相关的一系列问题
完成一个编程练习：要求将独立的 DNN 训练程序迁移到 DeepSpeed，将其执行分布到集群当中，并引入内存节省技术，这将允许进行有效的大规模训练。

培训证书：成功完成本课程和测试后，将获得 NVIDIA DLI 培训证书，证明在相关领域的能力，为职业发展提供证明

学习此课程的硬件要求：您需要一台笔记本电脑或台式机，且能够运行最新版 Chrome 或 Firefox 浏览器。我们为您提供在云端完全配置的加速工作站的专用访问权限。

课程语言：中文

学习更多 DLI 课程

通用基础

深度学习基础——理论与实践入门

8 学时 | 中文 | 收费培训 | Tensorflow 2 with Keras, Pandas

有培训证书

查看课程大纲

通用基础

构建基于 Transformer 的自然语言处理应用

8 学时 | 中文 | 收费培训 | PyTorch, Pandas, NVIDIA NeMo ™, NVIDIA Triton ™ 推理服务器

有培训证书

查看课程大纲

通用基础

数据并行——用多 GPU 训练神经网络

8 学时 | 中文 | 收费培训 | PyTorch、PyTorch 分布式数据并行、NCCL

有培训证书

查看课程大纲

通用基础

新课程

构建大语言模型 RAG 智能体

8 学时 | 中文 | 收费培训 | Python, LangChain, NVIDIA AI Foundation Endpoints, FAISS, Gradio, LangServe, FastAPI

有培训证书

查看课程大纲

如果您的企业希望获取或提升在 AI、加速数据科学或加速计算方面的核心技能，NVIDIA DLI 有讲师指导的培训将是您的信心之选。

咨询企业专属培训

遇到问题？

联系我们

对 NVIDIA 培训有任何问题，请微信联系 DLI 小助手 (微信号 NVIDIALearn），或填写如下表单。

Section

Section

名字

姓氏

工作电子邮件地址

组织/大学名称

行业

职务

地点

城市

State

请求联系的理由

nvid hidden field

ncid hidden field

NVIDIA 隐私政策

本人知悉且同意 NVIDIA <span class="corporation-txt hidden">Corporation </span>基于调研、活动组织的目的对本人的上述信息的收集和处理，并已经阅读并同意 <a href="https://www.nvidia.cn/about-nvidia/privacy-policy/?deeplink=visiting-our-website" target="_blank">NVIDIA 隐私政策</a>。

本人知悉且同意，因调研、活动组织的必须，以及相对应的 NVIDIA 内部管理和系统操作的需要，上述信息会被传输到位于美国的 NVIDIA Corporation 按照符合 <a href="https://www.nvidia.cn/about-nvidia/privacy-policy/?deeplink=visiting-our-website" target="_blank">NVIDIA 隐私政策</a>的方式进行存储，您可以通过发送邮件至 <a href="mailto:privacy@nvidia.com">privacy@nvidia.com</a> 进行联系以解决相关问题，实现可适用的数据保护法所规定的权利。

讲师指导的培训班
模型并行 —— 构建和部署大型
神经网络

学习目标

课程大纲

培训详情

学习更多 DLI 课程

深度学习基础——理论与实践入门

构建基于 Transformer 的自然语言处理应用

数据并行——用多 GPU 训练神经网络

构建大语言模型 RAG 智能体

如果您的企业希望获取或提升在 AI、加速数据科学或加速计算方面的核心技能，NVIDIA DLI 有讲师指导的培训将是您的信心之选。

遇到问题？

联系我们

查看 AI 培训班常见问题解答

咨询 NVIDIA DLI 培训

关于技术问题，请访问 NVIDIA 开发者论坛

NVIDIA DLI 培训证书

讲师指导的培训班 模型并行 —— 构建和部署大型 神经网络

学习目标

课程大纲

培训详情

学习更多 DLI 课程

深度学习基础——理论与实践入门

构建基于 Transformer 的自然语言处理应用

数据并行——用多 GPU 训练神经网络

构建大语言模型 RAG 智能体

如果您的企业希望获取或提升在 AI、加速数据科学或加速计算方面的核心技能，NVIDIA DLI 有讲师指导的培训将是您的信心之选。

遇到问题 ？

联系我们

查看 AI 培训班常见问题解答

咨询 NVIDIA DLI 培训

关于技术问题，请访问 NVIDIA 开发者论坛

NVIDIA DLI 培训证书

讲师指导的培训班
模型并行 —— 构建和部署大型
神经网络

遇到问题？