讲师指导的培训班
加速数据科学基础

数据科学是指使用科学方法、流程、算法和系统来分析数据并从中提取洞察。它使组织能够将数据转化为有价值的资源,从而实现更明智的决策、更高效的运营以及更好的客户体验。在本课程中,您将学习如何使用 GPU 加速工具更快地开展数据科学工作,从而获得更具可扩展性、更可靠且更具成本效益的结果。

 

学习目标
 

参加本次培训,您将学到:
  • 使用 cuDF 加速 pandas、Polars 和 Dask,高效分析各种规模的数据集
  • 使用多种机器学习算法 (包括 XGBoost) 解决不同的数据科学问题
  • 在 Triton Inference Server 上部署机器学习模型,以实现最佳性能
  • 学习并应用强大的图算法,使用 NetworkX 和 cuGraph 分析复杂网络
  • 在超大规模数据集上执行多种分析任务,以遏制影响英国的模拟疫情爆发

完成本课程后,您将能够更高效地完成各类数据科学任务,从而支持更多迭代周期,并显著提升整体生产力。

课程大纲待更新

课程大纲

议题 说明
课程介绍
(30 分钟)
  • 讲师介绍
  • 登录 DLI 学习平台
  • 课程总览
GPU 加速的数据处理
(120 分钟)

    摄取并准备多个数据集 (其中部分数据规模大于内存),用于本课程后续的多项机器学习练习:

  • 使用 pandas、Polars、cuDF 和 Dask 将数据直接读取到单 GPU 或多 GPU 上。
  • 使用 cuDF 在 GPU 上为机器学习任务准备人口、道路网络和诊所相关数据。
休息 (60 分钟)
GPU 加速的机器学习
(120 分钟)
  • 将多种关键机器学习技术应用于第一部分中准备好的数据:
  • 使用 cuML 提供的有监督与无监督 GPU 加速算法。
图分析
(120 分钟)
  • 执行图分析任务:
  • 使用 cuGraph 在 GPU 上创建并分析图数据。
休息 (15 分钟)
项目:用数据分析守护英国
(60 分钟)
  • 结合人口级别的数据,应用新学到的 GPU 加速数据处理与分析技能,帮助遏制影响整个英国人口的模拟疫情:
  • 使用 RAPIDS 集成多个超大规模数据集,并开展真实世界的数据分析。
  • 随着模拟疫情在每个模拟日产生新数据,不断调整和迭代分析方案。
评估测试和总结
(30 分钟)
  • 回顾所学要点
  • 运用所学内容,通过课程测试
  • 获取 NVIDIA 培训证书
下一步 学习更多 DLI 相关课程:
 

培训详情

课程时长:8 小时,课后 6 个月内可以继续访问课件和实验 (实验资源用量有限额)

课程模式:讲师实时授课,每位学员可使用云端完全配置的实验环境进行实战练习

价格:

  • AI 培训班每人 3500 元 (提供发票)
  • 企业专属培训:联系我们,微信添加 NVIDIALearn

预备知识:

使用的工具、库和框架:RAPIDS、cuDF、XGBoost、cuML、cuGraph、Dask、cuPy、pandas、Polars、NumPy 和 Bokeh

培训证书:成功完成本课程和测试后,学员将获得 NVIDIA DLI 培训证书,证明在相关领域的能力,为职业发展提供证明。

学习此课程的硬件要求:您需要一台能够上网的笔记本电脑或台式机,且能够运行最新版 Chrome 或Firefox 浏览器;我们为您提供在云端实验环境的专用访问权限。

课程语言:中文

如果您的企业希望获取或提升在 AI、加速数据科学或加速计算方面的核心技能,NVIDIA DLI 讲师指导的培训将是您的信心之选。

学习更多 DLI 课程

深度学习基础 —— 理论与实践入门

为大语言模型添加新知识

构建基于大语言模型 (LLM) 的应用

构建基于扩散模型的生成式 AI 应用

模型并行 —— 构建和部署大型神经网络

遇到问题?