数据中心解决方案

AI 工厂

加速并部署专为 AI 工厂打造的全栈式 AI 基础设施与软件。

概览

面向 AI 推理时代的 AI 工厂

AI 扩展定律正推动着从数据获取、训练到微调及深度推理等 AI 生命周期的各个阶段,对计算能力产生前所未有的需求。为了满足这一需求,一种新的运营模式应运而生:AI 工厂。与传统数据中心不同,AI 工厂专为规模化生产智能而建,它将加速基础设施与 AI 软件紧密整合,以优化 AI 基本单元 Token 的生成。

AI 工厂将能源、芯片、基础设施、模型和应用这五个关键层面整合为一个系统,专为代理式 AI物理 AI 和高性能计算 (HPC) 的需求而设计。借助 NVIDIA 的端到端加速计算解决方案,AI 工厂能够实现卓越的性能巅峰与能效表现,助力企业在确保安全性的前提下部署面向未来的 AI,从而实现投资回报率最大化。

了解 NVIDIA 如何构建 AI 工厂

了解 NVIDIA IT 部门如何在内部运用其 AI 工厂模式,以在企业内推广 AI 应用。 通过整合 AI 软件与基础设施,并部署 AI 智能体,NVIDIA 加速了生产力提升,优化了运营流程,并为规模化 AI 应用提供了一个实际可行的蓝图。

NVIDIA 发布 Vera Rubin DSX AI Factory 参考设计

NVIDIA Vera Rubin DSX AI Factory 参考设计和 Omniverse DSX Blueprint 相辅相成,一方面指导构建高效的 AI 基础设施,另一方面通过数字孪生技术,实现在部署前对 AI 工厂进行设计与仿真。

优势

构建、部署和连接 AI 工厂

借助 NVIDIA 的 AI 工厂,点燃您的竞争优势,大规模制造数字智能。体验前所未有的效率,加速 AI 推理,并为未来的创新做好准备。

加快价值实现

NVIDIA 的 AI 工厂提供预设计的机架级设计、安全 AI 和集成软件堆栈,作为可组合的、即日可用的构建模块,从而加速实现大规模智能。

提高每个 Token 的性能和能效

NVIDIA 的加速计算通过优化 AI 性能,同时大幅提高 AI 工厂和应用的能效,每瓦特生成更多的 Token。

合作伙伴生态系统验证

NVIDIA 携手全球合作伙伴,采用基于 NVIDIA 加速计算与参考架构的集成式全栈解决方案,共同构建 AI 工厂。

可扩展的 AI 部署

AI 工厂专为战略增长而构建,推动可扩展的智能制造,而模块化升级可最大限度提高 AI 投资和长期回报。

NVIDIA IT 部门的 AI 工厂推动企业级规模化创新

NVIDIA 构建了一个统一的 AI 工厂,将生成式 AI 和智能体工作流扩展至整个企业,确保安全性、性能和一致性。该平台支持数百个 AI 智能体,能够加速创新、简化软硬件工程流程并优化供应链运营——将规划时间缩短 95% 以上,一年内完成了相当于数十年的工程工作量。

基础设施

借助 NVIDIA 轻松构建和部署 AI 工厂

使用 NVIDIA Enterprise AI Factory 验证设计来大规模构建 AI 工厂,该设计为在 NVIDIA Blackwell 架构上部署代理式 AI、物理 AI 和高性能计算工作负载提供指导,并提供 NVIDIA 企业参考架构的推荐配置。

产品

AI 工厂背后的技术

NVIDIA Blackwell 架构、加速网络技术以及 NVIDIA AI 软件相结合,共同提供卓越的性能、可扩展性以及生产就绪型 AI 能力。

NVIDIA Blackwell:AI 工厂引擎

NVIDIA Blackwell 通过统一的体系架构为整个 AI 生命周期提供强大动力,实现了突破性的性能、能效比和扩展能力。它针对现代 AI 工作负载进行了优化,能够加速代理模型和推理模型的训练、微调及深度推理过程。

通过高带宽网络扩展 AI

NVIDIA 网络通过超低延迟和高带宽连接,最大限度地提升了 AI 训练和推理的性能。协同设计的 GPU、SuperNIC 和 DPU 确保了基础设施的高效与可扩展性,同时智能拥塞管理和自适应路由技术则优化了大规模多节点、多 GPU 环境下的性能表现。

加速 AI 开发和部署

NVIDIA AI Enterprise 是一款端到端的软件套件,旨在加速从开发到生产的企业级和代理式 AI 流程,助力各组织高效扩展。智能编排通过动态资源分配最大化 GPU 利用率,同时借助高级仿真和基于 OpenUSD 的工作流程,为物理 AI 和数字孪生应用提供强大支持。

NVIDIA Rubin 平台

NVIDIA Rubin 平台

新一代 AI

NVIDIA Rubin 平台为现代 AI 工厂注入强大动力,能够大规模加速代理式 AI 和高级推理。通过极致的芯片协同设计,它极大地提升了推理性能,相比 NVIDIA Blackwell 架构,能够实现每瓦更高的 Token 产出,并降低每个 Token 的成本。

解决方案

AI 工厂知识中心

探索与 NVIDIA 及其生态系统合作伙伴共同设计、构建和部署 AI 工厂的成熟架构、已验证设计及数据平台指导。

使用 NVIDIA 验证设计构建全栈式 AI 工厂

NVIDIA Enterprise AI Factory 是一项经过验证的设计,为构建和部署本地 AI 工厂提供了成熟且全栈式的指导。该设计在广泛的合作伙伴 ISV 生态系统中经过验证,确保了与主流企业级 AI 软件、开放模型及基础设施平台的互操作性。 它简化了部署流程,降低了风险,并加速了 AI 投入生产的进程。

利用 NVIDIA 企业参考架构加速 AI 基础设施建设

专为 AI 工厂设计的集群设计蓝图提供了跨计算、网络和存储的详细指导,并针对 AI 工作负载进行了优化。这些方案在 NVIDIA 认证的合作伙伴生态系统中经过全面验证,确保了与主流服务器、加速器和存储平台的互操作性,同时简化了部署与扩展过程,从而加速实现价值。

利用 NVIDIA AI 数据平台交付就绪的 AI 数据

这是一个可定制的参考设计,它将加速计算与企业存储相集成,以提供低延迟、高性能的 AI 数据管道。 该平台与顶尖存储合作伙伴共同构建,提升了代理式 AI 和检索增强工作流的性能与准确性。同时,通过采用零信任架构,结合加速加密与实时威胁检测技术,有效保护数据安全并确保合规性。

利用 NVIDIA DSX 参考设计部署 10 亿瓦级 AI 工厂

NVIDIA DSX 是一个综合框架,用于构建协同设计的 AI 基础设施,最大限度的提高每瓦 Token 产出并加快首次投产进程。 其开放、模块化的软件堆栈将计算、供电、冷却、网络和运维整合到一个统一的架构中,从而构建出可扩展且高能效的 AI 工厂。依托广泛的行业生态系统支持,DSX 助力企业简化部署流程、降低风险,以更高性能、更可靠的方式运营 AI 基础设施。

资源

阅读 AI 工厂相关新闻

面向新工业革命的 AI 工厂

了解如何利用 NVIDIA 技术构建 AI 工厂,为加速计算和实时生成式 AI 新时代提供支持。

利用数字孪生构建千兆瓦级 AI 工厂

了解适用于 AI 工厂数字孪生的 NVIDIA Omniverse Blueprint 如何推动数据中心的设计和优化,确保 AI 工厂适应未来需求。

AI 工厂

了解 AI 工厂如何生成 token 来助力构建充满无限可能的未来——由人类的智慧和 NVIDIA 加速推进。

后续步骤

准备好开始了吗?

了解如何大规模部署全栈式企业 AI 工厂。

购买渠道

探索产品和解决方案,帮助您开始针对 AI 工厂扩展 AI 基础设施,从而加快物理和代理式 AI 工作负载的价值实现。