面向数据中心的 AI 存储生态系统

NVIDIA CMX 上下文记忆存储平台

重构推理存储，开辟 AI 的下一个前沿领域。

概览
产品
优势
生态系统
资源
开始体验

概览
产品
优势
生态系统
资源
开始体验

AI 原生存储加速大规模长上下文推理

NVIDIA® CMX™ 上下文记忆存储是一个面向长上下文、多轮次和代理式 AI 推理的 AI 原生上下文层。它由 NVIDIA BlueField®‑4 存储处理器提供支持，通过共享的、针对 KV 缓存优化的 POD 级上下文层来扩展 GPU 内存。该平台提供了高带宽路径，可降低大规模推理工作负载的延迟、成本和功耗，从而帮助 NVIDIA Rubin 平台实现更高的吞吐量和更佳的能效。

NVIDIA BlueField-4 助力新型 AI 原生存储基础设施，推动 AI 迈向新前沿

NVIDIA CMX 助力扩展 GPU 容量，并在机架级 AI 系统中实现高带宽 KV 缓存共享。与传统存储相比，它可为长上下文、多轮次推理提供更高的吞吐量和更佳的能效。

阅读新闻稿

NVIDIA BlueField-4 助力上下文记忆存储平台，开辟 AI 的下一个前沿

NVIDIA CMX 采用 NVIDIA BlueField‑4、DOCA™ 和 Spectrum‑X™ 以太网来添加 POD 级上下文记忆层，为长上下文、代理式 AI 推理提供更高的吞吐和能效。

阅读博客

产品

端到端集成的 AI 原生存储基础设施

从加速上下文记忆和安全数据传输到以太网和推理框架，NVIDIA CMX 是计算、网络、存储和软件深度协同设计的成果。

NVIDIA BlueField-4

NVIDIA BlueField 平台提供突破性的性能、效率和创新，加速 NVIDIA CMX。BlueField-4 管理非易失性存储器 (NVMe) 固态硬盘 (SSD)，运行存储服务，并高能效地卸载 KV 缓存的数据完整性和加密计算任务。其先进的计算能力和用于网络、存储和安全的软件定义硬件加速器为各种工作负载打造了安全、高能效的基础设施。

借助 NVIDIA BlueField 实现数据中心转型

NVIDIA DOCA Memos

NVIDIA DOCA Memos 是面向 BlueField-4 和 CMX 优化的 SDK，可在 AI 计算节点和 CMX 数据节点之间管理和共享 KV 缓存，提供简单的键值 API，将以太网连接的闪存资源转变为 POD 级缓存层。它提供安全、低延迟的访问，对数据完整性和加密计算进行硬件加速，使应用保持无状态运行，而 CMX 处理大规模场景下的 KV 缓存路由和数据复用。

利用 DOCA Memos 加速 AI 推理

NVIDIA Spectrum-X 以太网网络

NVIDIA Spectrum-X 以太网提供高性能远程直接内存访问 (RDMA) 网络，支持对 Pod 内的 AI 原生 KV 缓存进行低延迟、高带宽的访问。Spectrum-X 以太网专为 AI 构建，采用先进的拥塞控制、动态路由和无损 RoCE 技术，最大限度地减少抖动和尾延迟，在大型多租户环境中提供一致、可重复的性能。这助力 CMX 以可预测的高性能进行扩展，最大限度地提升多轮次、代理式推理工作负载的吞吐量和响应能力。

应用 Spectrum-X 以太网扩展 AI 网络

NVIDIA Dynamo

NVIDIA Dynamo 是一个分布式推理服务框架，使 CMX 和底层上下文存储层在 Pod 中无缝呈现，将请求路由到 KV 缓存的位置。通过在服务层处理 KV 感知放置和复用，Dynamo 可提高每秒 Token 量、缩短首 Token 的生成时间，并支持 Pod 范围的上下文复用，以处理多轮次、多智能体工作负载。

应用 NVIDIA Dynamo 加速 AI 推理