NVIDIA DOCA 微服务

NVIDIA DOCA 软件平台

在 NVIDIA BlueField 和 ConnectX 上加速、保护和扩展代理式 AI 基础设施。

概览

什么是 NVIDIA DOCA?

NVIDIA DOCA™ 是一个统一的软件平台,可释放 NVIDIA® BlueField® DPUNVIDIA® ConnectX® SuperNIC™ 的全部潜力,并赋能代理式 AI 基础设施。它提供 SDK、库、生产就绪型微服务和编排框架,用于大规模构建和运行加速的基础设施服务,包括网络、AI 原生存储、运行时安全、遥测和生命周期管理。

NVIDIA 推出由 DOCA 赋能的、面向代理式 AI 的内置安全存储

由 DOCA 赋能的 NVIDIA Vera BlueField‑4 STX 定义了一种面向代理式 AI 的新型内置安全存储,可用于数据、智能体和内存的保护。

BlueField‑4 STX:由 DOCA 赋能的、面向代理式 AI 的安全存储

DOCA 为 BlueField-4 STX 提供在线智能体、数据和内存保护,确保代理式 AI 以基础设施速度安全运行。

示意图

NVIDIA DOCA 软件平台

NVIDIA DOCA 为基础设施团队提供所需的微服务、库和管理工具,以加速网络、强化运行时安全、管理 AI 原生存储,并保护基于 NVIDIA BlueField 和 NVIDIA ConnectX 的代理式 AI 工作负载。

优势

专为满足代理式 AI 基础设施的需求而构建

NVIDIA DOCA 为开发者和构建者提供软件基础模块,助力他们基于 NVIDIA BlueField 和 NVIDIA ConnectX 创建加速且差异化的基础设施服务。它简化了开发流程、加速了部署速度、扩展了创新范畴,并为主机、网络和数据路径提供了深度可编程、可视性和生命周期管理。

加速开发

借助企业级 API、参考应用和即用型微服务,实现网络、安全、存储、遥测和基础设施编排,从而加快产品上市和创新。

随处部署

为 BlueField 和 ConnectX 创建应用程序,并借助原生 Kubernetes 集成、一致的操作和按需扩展,轻松部署到企业、云和边缘环境。

提升性能

通过 BlueField 和 ConnectX 上专为网络、安全和数据处理而构建的引擎,实现硬件加速、软件定义的控制。

面向未来的基础设施

只需一次构建,即可在 BlueField 和 ConnectX 各代产品之间无缝迁移,同时享受新硬件性能带来的优势。

工作负载

赋能代理式 AI 工厂操作系统的软件平台

NVIDIA DOCA 为运行 AI 工厂提供软件基础,使开发人员能够构建智能、安全且高性能的基础设施服务,并在复杂的分布式环境中无限扩展。

入门选项

NVIDIA DOCA 入门指南

无论您是在评估基础设施平台、试点新用例,还是扩展到全面生产环境部署,NVIDIA DOCA 都能为您提供一条清晰的路径,助您加速构建安全的 AI 基础设施。

下载并构建

下载 NVIDIA DOCA SDK 并访问 API、库和示例应用程序,即可开始在 BlueField 和 ConnectX 上进行构建。

集成

从 NVIDIA NGC™ 拉取预构建的 DOCA 容器,即可在您的环境中快速部署可配置的基础设施微服务。

查阅文档

浏览完整的 DOCA 文档库,包括 SDK 指南、API 参考以及 BlueField 和 ConnectX 的发行说明。

在生产环境中部署

使用 NVIDIA AI Enterprise 支持的 DOCA,即可大规模部署可用于生产环境的企业级 BlueField。

DOCA 开发者日回顾

了解 DOCA 在网络、存储和网络安全领域的最新会议内容。

构建

构建全球 AI 基础设施

从超大规模云提供商到数据中心基础设施和网络安全创新者,全球领先的企业都在基于 NVIDIA DOCA 构建高性能软件平台,以满足客户对性能、安全性和扩展性的需求。

资源

最新的 NVIDIA DOCA 资源

浏览会议、博客和视频,深入了解 DOCA 微服务、库和加速 AI 基础设施。

NVIDIA DOCA 软件框架

花一分钟了解 NVIDIA DOCA 如何从内到外保护您的 AI 工厂。

使用 NVIDIA BlueField DPU 配置基于主机的防火墙

了解如何通过 NVIDIA BlueField 上的一个配置,将防火墙直接部署在芯片内部,使其免受攻击者的入侵,而无需依赖于主机。

常见问题解答

关于 NVIDIA DOCA 的常见问题

NVIDIA DOCA 平台是一个统一的软件基础,能够释放 NVIDIA BlueField DPU 和 NVIDIA ConnectX SuperNIC 的全部潜力,并赋能代理式 AI 基础设施。它提供微服务、库、驱动程序和编排框架,用于构建和运行加速的代理式 AI 工厂。

数据处理单元 (DPU) 是一种可编程处理器,将网络、安全和存储等以数据为中心的任务从服务器的主 CPU 中卸载、加速和隔离。NVIDIA DOCA 是一个软件框架,它能够释放 DPU 的全部潜能,类似 CUDA® 实现 GPU 编程的方式。

SuperNIC 是一类专门设计的网络加速器,满足代理式 AI 工厂中 AI 工作负载的高速、严苛的网络需求。与专为通用计算设计的传统网卡不同,SuperNIC 专为加速数千个 GPU 之间的数据传输而构建,从而避免大规模 AI 训练和推理过程中出现瓶颈。

DOCA 是一个完整的软件平台,包含三个不同的层。DOCA 微服务是可直接部署的生产就绪型容器化基础设施服务,例如 DOCA Argus 和 DOCA SNAP,它们可以从 NVIDIA NGC 拉取并直接部署,无需定制开发。DOCA 库是可编程 API,使开发者能够直接访问 BlueField 硬件功能 (例如数据包处理、拥塞控制和 GPU 网络),从而构建定制的高性能基础设施服务。DOCA 驱动程序提供连接平台与 BlueField 和 ConnectX 硬件的基础网络、安全和存储接口。

DOCA 平台框架 (DPF) 是一个 Kubernetes 原生编排框架,可将 BlueField DPU 作为 Kubernetes 节点进行配置、管理和扩展。它可自动执行固件更新、生命周期管理以及跨 DPU 集群的 DOCA 服务部署,使平台团队能够使用与管理其他基础设施相同的工具来管理数千个 DPU,而无需直接进行硬件编程。

DOCA 支持两种部署路径。对于预构建的服务,DOCA 微服务以容器形式在 NVIDIA NGC 上提供,并可以使用标准容器编排工具直接部署到生产环境中。对于定制开发,DOCA SDK 提供了在 BlueField 和 ConnectX 上构建和部署定制服务所需的库、驱动程序和 API。DPF 提供了 Kubernetes 原生编排层,用于在生产基础设施中配置、管理和扩展 DPU 集群。

DOCA 为 BlueField DPU 和 ConnectX SuperNIC 提供跨代支持,确保当前构建的应用程序在未来新一代的硬件中也能获得更佳的性能,而无需修改代码。

后续步骤

准备好利用 DOCA 改造您的基础设施了吗?

无论您是为企业评估 NVIDIA DOCA、在 BlueField 上部署微服务,还是构建定制应用程序,NVIDIA 都能为您提供入门指南。

与 NVIDIA DOCA 专家交流

联系 NVIDIA 网络专家,讨论您的 AI 基础设施用例,并获取将 DOCA 集成到您的技术栈中的指导。

随时了解 DOCA 社区的最新动态

在您的订阅中获取最新的 NVIDIA DOCA 版本说明、开发者博客和活动公告。