数据科学是指使用科学方法、流程、算法和系统来分析数据并从中提取洞察。它使组织能够将数据转化为有价值的资源,从而实现更明智的决策、更高效的运营以及更好的客户体验。在本课程中,您将学习如何使用 GPU 加速工具更快地开展数据科学工作,从而获得更具可扩展性、更可靠且更具成本效益的结果。
学习目标
- 使用 cuDF 加速 pandas、Polars 和 Dask,高效分析各种规模的数据集
- 使用多种机器学习算法 (包括 XGBoost) 解决不同的数据科学问题
- 在 Triton Inference Server 上部署机器学习模型,以实现最佳性能
- 学习并应用强大的图算法,使用 NetworkX 和 cuGraph 分析复杂网络
- 在超大规模数据集上执行多种分析任务,以遏制影响英国的模拟疫情爆发
完成本课程后,您将能够更高效地完成各类数据科学任务,从而支持更多迭代周期,并显著提升整体生产力。
课程大纲待更新
