讲师指导的培训班
为大语言模型添加知识

大语言模型(LLMs)功能强大,但它们的知识通常是通用的,可能缺乏企业应用所需的特定、最新或专业信息。"为大语言模型添加知识" 课程提供了一个全面、实践的指南,涵盖增强和定制 LLM 的核心技术。

本课程将带您从原始数据出发,走完构建一个经过优化的微调模型的完整流程。首先,您将学习如何使用 NVIDIA NeMo Curator 筛选高质量数据集并生成合成数据。接着,深入掌握模型评估过程,使用基准测试、LLM-as-a-judge 和 NeMo Evaluator 严格评估模型性能。在打下坚实评估基础之后,您将学习一系列强大的定制技术,包括使用持续预训练注入新知识、通过监督微调教授新技能,以及使用直接偏好优化(DPO)使模型行为更符合人类偏好。

最后,您将学习如何通过量化、剪枝和知识蒸馏等优化技术(基于 TensorRT-LLM 和 NeMo 框架)让您的定制模型在实际部署中高效运行。课程最终将通过一次实践评估收尾,您将在其中运用所学内容将 LLM 调整为特定的对话风格,全面掌握为任何应用场景定制模型的能力。

 

学习目标

通过本课程,您将掌握以下技能:

  • 使用 NVIDIA NeMo Curator 筛选高质量数据集并生成合成数据
  • 结合基准测试(如 MMLU)、LLM-as-a-judge 和 NeMo Evaluator 严格评估模型性能
  • 通过持续预训练(CPT)为 LLM 注入特定领域的新知识
  • 通过监督微调(SFT)让 LLM 学习新技能并完成特定任务
  • 使用直接偏好优化(DPO)使模型在风格、语气和安全性方面更贴近人类偏好
  • 通过 TensorRT-LLM 和 NeMo 进行量化、剪枝与知识蒸馏,压缩并优化 LLM 以实现高效部署
  • 掌握端到端的模型定制工作流,用于解决真实世界的问题

下载课程大纲 (PDF 368 KB)

 

课程涵盖的主题与技术:

为帮助学习和演示如何为 LLM 增加知识并进行企业级定制,本课程将涵盖以下主题与技术:

  • 数据筛选与合成数据生成
  • 高级 LLM 评估技术(包括 LLM-as-a-Judge 和 ELO)
  • 持续预训练(CPT)用于知识注入
  • 监督微调(SFT)用于技能习得
  • 直接偏好优化(DPO)用于行为对齐
  • 模型优化:量化、剪枝与知识蒸馏
  • NVIDIA NeMo 框架、NeMo Curator、NeMo Evaluator 与 NeMo-RL
  • TensorRT-LLM 高性能推理优化

课程大纲

议题 说明
课程介绍
(15 分钟)
  • 讲师介绍
  • 登录 DLI 学习平台
数据筛选与合成数据生成
(60 分钟)
  • 使用 NVIDIA NeMo Curator 构建大规模高质量数据集。
  • 执行关键数据筛选任务:文本清洗、过滤和 PII 去除。
  • 生成高质量的问答对数据,用于构建稳健的 SFT 数据集。
  • 理解数据质量在 LLM 开发生命周期中的重要性。
大语言模型评估
(75 分钟)
  • 从简单的“目测”到系统的量化方法,全面了解多种评估技术
  • 使用 MMLU 等行业标准基准测试评估模型
  • 实现 LLM-as-a-judge 进行更细致的自动化评估
  • 使用 NeMo Evaluator 微服务比较 zero-shot 与 few-shot(上下文学习)表现
  • 使用 MLflow 跟踪与可视化评估实验
休息 (60 分钟)
LLM 定制
(120 分钟)
  • 深入三大定制技术:CPT、SFT 和 DPO
  • 通过 CPT 教会模型一个特定领域的新知识
  • 使用 SFT 教会模型新技能,比如用另一种语言解数学题
  • 利用 DPO 将模型对话风格调整为人类偏好(如正式与非正式语气、特定方言等)
  • 通过 NeMo 框架动手实践完成定制任务
为部署优化 LLM
(120 分钟)
  • 学习如何压缩和加速 LLM,以实现高效推理。
  • 使用 TensorRT-LLM 应用后训练量化(PTQ),减少模型尺寸与内存占用,重点使用 FP8 格式。
  • 通过层级剪枝(Depth Pruning)删除整个层以减小模型规模。
  • 使用知识蒸馏技术,训练小型“学生”模型模仿大型“教师”模型,以恢复剪枝带来的性能损失。
  • 权衡每种优化技术在性能与准确率上的利弊。
互动式评估
(30 分钟)
  • 在实践编程任务中运用所学知识。
  • 使用 DPO 将 Llama 3.1 8B 模型调整为特定对话风格(如莎士比亚式英文)。
  • 展示您准备偏好数据集、使用 NeMo-RL 运行对齐任务并评估最终模型的能力。
  • 成功完成评估后可获得 NVIDIA 培训证书。
下一步
 

培训详情

课程时长:8 小时,课后 6 个月内可以继续访问课件(实验资源用量有限额)

课程模式:讲师实时授课,每位学员可使用完全配置的云端实验环境进行练习

价格:

  • AI 培训班:每人 3500 元(提供发票)
  • 企业专属培训:联系我们,微信添加 NVIDIALearn

预备知识:

  • 熟悉 Python 编程与 Jupyter notebook
  • 了解大语言模型及其应用
  • 具备深度学习与神经网络的基本概念

使用的工具、库和框架:Python,NVIDIA NeMo, NVIDIA TensorRT-LLM, Docker, MLflow

课程评测方式:运用所学内容将 LLM 调整为特定的对话风格,掌握根据场景定制模型的能力

培训证书:成功完成本课程和测试后,学员将获得 NVIDIA DLI 培训证书,证明在相关领域的能力,为职业发展提供证明

学习此课程的硬件要求:您需要一台笔记本电脑或台式机,且能够运行最新版 Chrome 或 Firefox 浏览器。我们为您提供在云端实验环境的专用访问权限

课程语言:中文

Upcoming Public Workshops

If your organization is interested in boosting and developing key skills in AI, accelerated data science, or accelerated computing, you can request instructor-led training from the NVIDIA DLI.

学习更多 DLI 课程

使用大语言模型(LLM)构建 AI 智能体

使用 NVIDIA NIM 大规模部署 RAG 工作流

高效定制大语言模型 (LLM)

构建基于大语言模型 (LLM) 的应用

利用提示工程构建大语言模型 (LLM) 应用

使用多模态模型构建 AI 智能体

构建大语言模型 RAG 智能体

构建基于扩散模型的生成式 AI 应用

如果您的企业希望获取或提升在 AI、加速数据科学或加速计算方面的核心技能,NVIDIA DLI 有讲师指导的培训将是您的信心之选。

遇到问题?