面向代理式 AI 打造的 CPU。
NVIDIA Vera CPU 机架为 AI 工厂规模的强化学习和代理式 AI 提供支持。它基于 NVIDIA MGX™ 构建,集成多达 256 个 Vera CPU,可同时运行超过 2.25 万个并发环境。
亮点
代理式 AI 受限于传统 CPU 的瓶颈。在智能体的推理循环中,CPU 查询 SQLite 内存、编译生成的代码、运行 Python 工具链,并使用正则表达式解析输出。NVIDIA Vera 可将所有五种工作负载加速至主流 x86 CPU 的 1.8 倍,从而对代理式内循环进行涡轮加速,以以更大限度提升 AI 工厂输出。
基于测量数据的相对性能,并可能发生变化。以 AMD 霄龙 Turin 系列 x86 处理器为基准,在代码编译、解释器、脚本运行、运行时引擎、数据抽取转换加载 (ETL)、数据分析及图计算等各类工作负载下,对 NVIDIA Vera 处理器进行性能对比测试。
基于测量数据的相对性能,并可能发生变化。配备 LPDDR5X 的 NVIDIA Vera CPU 性能以配备 DDR5 的 x86 CPU (AMD EPYC Turin) 为基准,涵盖关键 CPU 内存性能指标。
传统的 DDR5 需要在带宽、效率和可维护性之间权衡。NVIDIA Vera 搭配 LPDDR5X 内存与 SOCAMM 模组。该模组支持拆卸、现场更换,兼具低功耗特性、服务器级灵活性与可扩容能力。与采用 DDR5 的主流 x86 CPU 相比,其带宽提升了 2 倍、每核心带宽提升了 3 倍、能效提升了 4 倍,从而在 Hyperscale 和企业级规模下实现了更高的 AI 工厂输出。
用例
特性
NVIDIA Vera 专为满足强化学习和代理式 AI 的需求而构建,结合了定制设计的 Olympus 核心、高带宽 LPDDR5X 内存和低延迟的 NVIDIA 可扩展一致性网络 (SCF)。凭借 NVIDIA NVLink™-C2C 连接、机密计算和完全的 Arm® 兼容性,Vera 扩展到加速系统和现代数据中心环境。其单片计算架构可保障软件环境响应迅速、数据高效流转,全面提升人工智能、数据分析与高性能计算负载的吞吐量、能效及 GPU 利用率。
开始使用
注册以接收 NVIDIA 发布的最新资讯与动态。