得益于计算能力的提升和科学理论的进步,生成式 AI 离我们越来越近,特别是其在创造性内容生成、数据增强、仿真规划、异常检测、药物研发和个性化推荐等诸多方面所展现出的非凡成就,生成式 AI 将在各行各业中扮演愈发重要的角色。在本课程中,我们将深入探讨去噪扩散模型,这是当下从文本转换为图像的一种非常流行的手段,正在颠覆着多个行业的发展。

 

学习目标

参加本次培训,您将学到:

>构建 U-Net 模型从纯噪声出发生成图像

>使用去噪扩散过程提高生成图像的质量

>使用上下文的嵌入向量控制图像的输出

>使用对比语言-图像预训练 (CLIP) 神经网络按照英文文本提示生成图像

下载课程大纲文档 (PDF 323 KB)

课程大纲

议题 说明
课程介绍
(15 分钟)
  • 讲师介绍
  • 登录 DLI 学习平台
从U-Net 到扩散模型
(60 分钟)
  • 构建一个U-Net,即一种图像自编码器
  • 学习转置卷积来放大图像
  • 学习非序列化的神经网络和残差连接
  • 尝试向 U-Net 注入噪声来生成新图像
休息(10 分钟)
扩散过程
(90 分钟)
  • 了解如何使用前向扩散过程 (DDPM) 创建一系列噪声越来越大的图像
  • 了解如何在噪声生成序列中向前跳过以加快网络训练 (DDIM)
  • 使用贝叶斯定理去除图像中的噪声以进行反向扩散过程
休息(60 分钟)
通过上下文进行控制
(60 分钟)
  • 了解如何通过添加上下文嵌入来更改扩散过程的输出
  • 添加额外的模型优化,例如
  • 正弦位置嵌入
  • 高斯误差线性单元(GELU) 激活函数
  • 注意力机制

使用 CLIP 将文本转换为图像
(60 分钟)
  • 循序解析 CLIP 架构,了解它如何将图像嵌入与文本嵌入关联起来
  • 使用 CLIP 来训练文本到图像的扩散模型
休息(10 分钟)
当下领先的模型
(60 分钟)
  • 了解多种目前最先进的生成式 AI 模型,并将它们与课上所学的概念关联起来
  • 讨论提示工程以及如何更好地影响生成式 AI 模型的输出
值得信赖的人工智能和总结
(60 分钟)
  • 了解内容真实性以及如何构建值得信赖的模型
  • 回顾所学要点并解答问题
  • 完成评估并获得证书
  • 填写培训调查表
下一步 学习更多 DLI 相关课程:
 

培训详情

课程时长:8 小时,课后 6 个月内可以继续访问课件(实验资源用量有限额)

课程模式:讲师实时授课,每位学员可使用云端完全配置的加速工作站实验练习

价格

  • AI 培训班:每人 3500 元(提供发票)
  • 企业专属培训:联系我们,微信添加 NVIDIALearn

预备知识

使用的工具、库和框架:PyTorch, CLIP

课程测评问题类型

  • 多项选择题:关于基础理论的掌握程度
  • 编程技能评测:关于创建去噪扩散隐式模型

培训证书:成功完成本课程和测试后,学员将获得 NVIDIA DLI 培训证书,证明在相关领域的能力,为职业发展提供证明

学习此课程的硬件要求:您需要一台笔记本电脑或台式机,且能够运行最新版 Chrome 或 Firefox 浏览器。我们为您提供在云端完全配置的 GPU 加速工作站的专用访问权限

即将举行的公开培训

模型并行 —— 构建和部署大型神经网络
2022 年 11 月 17 日(星期四)凌晨 1:00 至上午 9:00(北京时间)

加速计算基础知识 – CUDA C/C++
2023 年 1 月 12 日(星期四)凌晨 1:00 至上午 9:00(北京时间)

用于工业检测的计算机视觉
2023 年 1 月 19 日(星期四)凌晨 1:00 至上午 9:00(北京时间)

如果您的企业希望获取或提升在 AI、加速数据科学或加速计算方面的核心技能,NVIDIA DLI 有讲师指导的培训将是您的信心之选。

学习更多 DLI 课程

构建基于 Transformer 的自然语言处理应用

数据并行 —— 用多 GPU 训练神经网络

模型并行 —— 构建和部署大型神经网络

如果您的企业希望获取或提升在 AI、加速数据科学或加速计算方面的核心技能,NVIDIA DLI 有讲师指导的培训将是您的信心之选。

遇到问题?

Get Answers to Your DLI Questions
NVIDIA Deep Learning institute services
Visit Developer Forums