关于本书 - 加速 Apache Spark 3

Apache Spark 是一款功能强大的执行引擎,用于跨计算机集群进行大规模并行数据处理,从而实现快速应用程序开发和高性能表现。

在本电子书中,您将了解 Spark 3 的创新如何助力使用 GPU 的大规模并行架构来进一步加速 Spark 数据处理。

填写表单下载电子书并了解以下内容:

  • 数据处理从 Hadoop 到 GPU 和 NVIDIA RAPIDS™ 库的演进
  • Spark 的含义、作用及重要性
  • Spark 中的 GPU 加速
  • DataFrame 和 Spark SQL
  • 带随机森林分类器的 Spark 回归示例
  • 端到端机器学习工作流程(利用 XGBoost 进行 GPU 加速)的示例
Apache Spark