This site requires Javascript in order to view all its content. Please enable Javascript in order to access all the functionality of this web site. Here are the instructions how to enable JavaScript in your web browser.

NVIDIA 加速数据科学

开创先河的硬件到软件堆栈，已针对数据科学进行优化。

特性
解决方案
信息图
RAPIDS
合作伙伴

特性
解决方案
信息图
RAPIDS
合作伙伴

GPU 加速数据科学工作流程

一直以来，数据科学工作流程缓慢又繁琐，无论是加载、筛选和操控数据，还是训练和部署模型，都依赖于 CPU 来完成。借助 NVIDIA AI 软件（包括 RAPIDS™ 开源软件库），GPU 可显著降低基础设施成本，并使端到端数据科学工作流程实现卓越性能。从笔记本电脑到数据中心，再到边缘和云端，GPU 加速的数据科学无处不在。

特性和优势

更大限度提升工作效率

减少为获得宝贵见解而等待的时间，并加快提升投资回报率。

达成更多

可将机器学习训练速度提升高达 215 倍，执行更多迭代，增加实验，并进行更深入的探索。

更高效

降低数据科学基础设施成本，同时提升数据中心效率。

借助 RAPIDS 实现零代码更改

适用于 Spark、pandas 和 networkX。

150 倍

借助 cuDF 提升 Pandas 的速度

* 根据 Groupy 高级操作 (5GB) DuckDB 数据基准进行基准测试

硬件：英特尔至强 Platinum 8480CL CPU 和 NVIDIA Grace Hopper™ GPU

软件：pandas v1.5 和 cudf.pandas v23.10

5 倍

借助 RAPIDS 加速器来提升 Spark 的速度

* NDS 2.0 基准测试是在 SF3K 关闭 UCX 的情况下使用 Parquet 十进制数据进行的

仅 CPU：8 个 n1-standard-32 CPU

GPU：8 个 g2-standard-16 GPU、8 个 L4 24GB GPU

软件：Spark RAPIDS 24.02

48 倍

借助 cuGraph 提升 NetworkX 的速度

* 使用具有约 16,384 个顶点和约 524,288 个边的合成数据集对 PageRank 进行基准测试

硬件：英特尔至强 Platinum 8480CL CPU 和 NVIDIA H100 80GB（1 个 GPU）

软件：NetworkX v3.2 和 cuGraph v23.10

使用 NVIDIA GPU 训练 XGBOOST

在单节点部署和分布式部署中，GPU 加速的 XGBoost 可为领先的机器学习算法带来颠覆以往的性能。由于训练速度比 CPU 快得多，数据科学团队可以处理更大的数据集、更快地迭代，并调优模型以更大限度地提升预测精度和业务价值。

数据准备

XGBoost

端到端

CPU: Core i9 | 端到端时间 = 数据准备 + 转换 + 训练 + 验证

立即了解如何开始使用 GPU 加速的 XGBoost

NVIDIA GPU 数据科学解决方案

了解各种不同的 NVIDIA GPU 解决方案提供的惊人加速

PC

开启机器学习之旅。

工作站

新一代数据科学工作站。

数据中心

适用于企业生产的 AI 系统。

云

功能多样的加速机器学习。

GPU 加速的业务的实际应用

更大限度提升机器学习工作流程的性能、生产率和投资回报率。

RAPIDS：数据科学库套件

RAPIDS 基于 NVIDIA CUDA-X AI，充分利用了超过 15 年的 NVIDIA® CUDA® 开发和机器学习专业知识。这是一款功能强大的软件，用于完全在 NVIDIA GPU 中执行端到端的数据科学训练流程，可将训练时间从数天减少到数分钟。

下载源代码

下载 NGC 容器

RAPIDS 作为 GPU 加速数据科学平台，是由 Apache Arrow 提供动力支持的新一代计算生态系统。NVIDIA 与 Ursa Labs 携手合作，将加快 Arrow 核心库的创新步伐，并有助于在分析和特征工程工作负载方面带来重大的性能提升。

- Wes McKinney，Ursa Labs 总经理，同时也是 Apache Arrow 和 Pandas 创建者

我使用 RAPIDS XGBOOST 获得了 24 倍加速，现在借助 8 块 GPU，我可以在单个节点上运行规模超大的机器学习 (ML) 工作负载，取代原先的数百个 CPU 节点。你们使 XGBOOST 实现了神速提升，真是不可思议！

- 流媒体公司

我过去遇到的瓶颈是输入/输出 (I/O)。…… 输入 10 家店铺的数据（约 1 百万行）需耗时 10 分钟。借助 RAPIDS，不到 3 分钟时间，我们便能输入约 6000 家店铺的数据（数百万行）。相比之下，旧有基础设施在处理同等规模的数据时很容易就让我们花上四天时间…… 简直太棒了。

一位拥有 6000 家门店的中端市场专业零售商

cont-q-1
cont-q-2
cont-q-3

合作伙伴生态系统

RAPIDS 面向所有人开放，并在全球范围内的数据科学和分析领域得到广泛应用。我们的合作伙伴正在齐心协力地利用 GPU 加速分析、机器学习和深度学习方面的技术进步，彻底革新传统的大数据分析生态系统。

在线研讨会

在 NVIDIA 提供支持的数据科学工作站上转变 AI 开发

借助 XGBoost 提高机器学习性能和工作效率

RAPIDS 助力实现医疗保健领域的 GPU 加速数据科学

借助 RAPIDS 和 DGX-2 实现端到端数据科学加速

查看更多在线研讨会

探索 GPU 加速的硬件解决方案