如何开始使用 NVIDIA NeMo

使用可在生产环境中构建、监测和优化 AI 智能体的综合工具套件来管理 AI 智能体的生命周期。

从 AI 模型到代理式 AI 应用之旅

体验端到端企业就绪型平台,在 AI 智能体的整个生命周期中进行管理。

探索模型

体验 NVIDIA 优化的基础模型,例如 NVIDIA Nemotron™

借助 NeMo 进行专业开发

使用 NVIDIA NeMo™ 构建、监测和优化 AI 智能体。

部署代理式工作流

借助 NVIDIA Blueprint 快速构建 AI 解决方案。

用于管理 AI 智能体生命周期的工具

NVIDIA NeMo 软件工具套件是一个用于构建、定制和部署 AI 智能体的综合平台。它结合了开源库和微服务,以加速 AI 开发。

功能 使用此工具 开始使用
使用开放、高精度、高能效的模型构建代理式 AI 应用。 <strong>NVIDIA Nemotron</strong><br> 用于推理、RAG、语音、视觉和安全性的先进开放模型,用于构建企业级代理式 AI 应用。 <div class="nv-text"> <ul> <li><a href="https://www.nvidia.com/en-us/ai-data-science/products/nemo/get-started/" target="_blank">体验 Nemotron 模型</a></li> </ul> </div>
借助代码级控制和灵活性,大规模构建、微调和调整生成式 AI 模型。 <strong>NeMo 框架</strong><br> 用于数据生成、数据管理、预训练、后训练、强化学习、评估和多模态模型防护的开源库集合,可从单个 GPU 扩展到数千个 GPU。 <div class="nv-text"> <ul> <li><a href="https://docs.nvidia.com/nemo/#framework" target="_blank">文档</a></li> <li><a href="https://catalog.ngc.nvidia.com/orgs/nvidia/containers/nemo" target="_blank">下载容器</a></li> <li><a href="https://github.com/NVIDIA/NeMo" target="_blank">访问开源代码</a></li> </ul> </div>
生成用于训练、微调或评估模型的高质量合成数据集。 <strong>NeMo Data Designer</strong><br> 从头开始设计特定领域的数据集或种子示例,以消除数据瓶颈并加速 AI 开发。 <div class="nv-text"> <ul> <li><a href="https://docs.nvidia.com/nemo/microservices/latest/generate-synthetic-data/index.html" target="_blank">文档</a></li> <li><a href="https://github.com/NVIDIA/GenerativeAIExamples/tree/main/nemo/NeMo-Data-Designer" target="_blank">Example Notebook</a></li> </ul> </div>
为 AI 开发工作流准备大型多模态数据集。 <strong>NeMo Curator</strong><br> 使用开放的 GPU 加速 Python 库清理、筛选和准备多模态数据。 <div class="nv-text"> <ul> <li><a href="https://docs.nvidia.com/nemo/curator/latest/" target="_blank">文档</a></li> <li><a href="https://catalog.ngc.nvidia.com/orgs/nvidia/containers/nemo-curator" target="_blank">体验 Container</a></li> <li><a href="https://github.com/NVIDIA/NeMo-Curator" target="_blank">访问开源代码</a></li> </ul> </div>
使用强化学习 (RL) 训练和专业化智能体 <strong>NeMo RL</strong><br> 使用先进的强化学习技术大规模地对模型进行后训练和对齐。 <div class="nv-text"> <ul> <li><a href="https://docs.nvidia.com/nemo/rl/latest/index.html" target="_blank">文档</a></li> <li><a href="https://catalog.ngc.nvidia.com/orgs/nvidia/containers/nemo-rl?version=v0.5.0" target="_blank">下载容器</a></li> <li><a href="https://github.com/NVIDIA-NeMo/RL" target="_blank">访问开源代码</a></li> </ul> </div>
定义和管理可扩展的强化学习环境,用于智能体训练 <strong>NeMo Gym</strong><br> 构建、管理和扩展强化学习环境,为智能体专业化所需的强化学习训练生成高质量、可验证的部署数据。 <div class="nv-text"> <ul> <li><a href="https://docs.nvidia.com/nemo/gym/0.1.0/index.html" target="_blank">文档</a></li> <li><a href="https://github.com/NVIDIA-NeMo/Gym" target="_blank">访问开源代码</a></li> </ul> </div>
集成并公开易于使用的 API,以加速模型微调和对齐,并为代理式 AI 工作流提供支持。 <strong>NeMo Customizer</strong><br> 使用专有域数据简化和扩展微调。 <div class="nv-text"> <ul> <li><a href="https://docs.nvidia.com/nemo/microservices/latest/fine-tune/index.html" target="_blank">文档</a></li> <li><a href="https://catalog.ngc.nvidia.com/orgs/nvidia/teams/nemo-microservices/containers/customizer" target="_blank">体验 Microservice</a></li> </ul> </div>
评估模型和智能体工作流的性能。 <strong>NeMo Evaluator</strong><br> 借助简化的部署、基准支持和高级工具,评估模型和智能体的性能。 <div class="nv-text"> <ul> <li><a href="https://docs.nvidia.com/nemo/microservices/latest/evaluate/index.html" target="_blank">文档</a></li> <li><a href="https://github.com/NVIDIA-NeMo/Evaluator" target="_blank">访问开源 SDK</a></li> <li><a href="https://catalog.ngc.nvidia.com/orgs/nvidia/teams/nemo-microservices/containers/evaluator" target="_blank">体验微服务</a></li> </ul> </div>
借助代码级控制和灵活性,大规模构建、微调和调整生成式 AI 模型。 <strong>NeMo Framework</strong><br> 支持多模态模型的无缝预训练、后训练和强化学习,可从单个 GPU 扩展到数千个。 <div class="nv-text"> <ul> <li><a href="https://docs.nvidia.com/nemo-framework/user-guide/latest/overview.html" target="_blank">文档</a></li> <li><a href="https://catalog.ngc.nvidia.com/orgs/nvidia/containers/nemo" target="_blank">体验 Container</a></li> <li><a href="https://github.com/NVIDIA/NeMo" target="_blank">访问开源代码</a></li> </ul> </div>
构建检索增强生成 (RAG) 工作流,将您的 AI 智能体连接到数据。 <strong>NeMo Retriever</strong><br> 构建高精度、可扩展的流程,在 Nemotron 开源模型的支持下,从复杂文档中提取文本、表格、图表和图像,并为 RAG 准备企业数据。 <div class="nv-text"> <ul> <li><a href="https://docs.nvidia.com/nemo/retriever/latest/" target="_blank">文档</a></li> <li><a href="https://www.nvidia.com/en-us/ai-data-science/products/nemo/get-started/" target="_blank">体验 Retriever 模型</a></li> </ul> </div>
确保您的客服人员针对主题作出安全的回答。 <strong>NeMo Guardrails</strong><br> 利用可编程编排层,确保运行时的安全性和主题相关性。 <div class="nv-text"> <ul> <li><a href="https://docs.nvidia.com/nemo/guardrails/latest/" target="_blank">文档</a></li> <li><a href="https://catalog.ngc.nvidia.com/orgs/nvidia/teams/nemo-microservices/containers/guardrails" target="_blank">体验微服务</a></li> <li><a href="https://github.com/NVIDIA/NeMo-Guardrails" target="_blank">访问开源工具包</a></li> </ul> </div>
部署模型以实现高性能推理。 <strong>NVIDIA NIM</strong><br> 借助容器化微服务,随时随地安全可靠地部署 AI 模型。 <div class="nv-text"> <ul> <li><a href="https://docs.nvidia.com/nim/" target="_blank">文档</a></li> <li><a href="https://developer.nvidia.cn/nim" target="_blank">体验 NIM</a></li> </ul> </div>
监测和优化 AI 智能体的性能。 <strong>NeMo Agent Toolkit</strong><br> 使用开源与框架无关的库配置、评估和优化代理式系统。 <div class="nv-text"> <ul> <li><a href="https://docs.nvidia.com/nemo/agent-toolkit/latest/" target="_blank">文档</a></li> <li><a href="https://github.com/NVIDIA/NeMo-Agent-Toolkit" target="_blank">访问开源代码</a></li> </ul> </div>

常见问题解答

NVIDIA NeMo 是一个全面的企业级平台,用于构建、部署和优化代理式系统,从数据管理、模型定制和评估,到部署、编排和持续优化。它与现有 AI 生态系统和平台无缝集成,为构建 AI 智能体奠定了基础,加速了在任何云、本地或混合环境中构建智能体系统的进程。它支持快速扩展和轻松创建数据飞轮,利用最新信息持续改进 AI 智能体。

NeMo 作为 NVIDIA AI Enterprise 的一部分提供。有关完整的定价和许可信息,请查看此处

NeMo 可用于定制大语言模型 (LLM)、视觉语言模型 (VLM)、自动语音识别 (ASR) 和文本转语音 (TTS) 模型。

NVIDIA AI Enterprise 中提供了 NVIDIA 企业级标准支持服务。如需其他可用的支持和服务,如 NVIDIA 业务关键型支持、技术客户经理、培训和专业服务,请参阅 NVIDIA 企业支持与服务指南

NVIDIA NeMo Framework 是一个开源生成式 AI 框架,专为寻求精细控制和代码级灵活性的研究人员和开发者而构建,以高效地大规模构建生成式 AI 模型。它支持多模态生成式 AI 模型的预训练、后训练和强化学习。

NVIDIA NeMo 微服务是基于 NeMo 框架构建的企业级 API 模块化产品,使开发者能够轻松、快速地大规模定制和部署 AI 智能体。它简化了模型微调、评估、护栏和合成数据生成的工作,并且可无缝集成到现有 AI 平台中,使企业能够加速自定义 AI 智能体开发,并通过数据飞轮工作流持续优化它们。

NeMo Data Designer 是一款专为 AI 开发者打造的微服务 (也可作为开放库使用),通过可配置的架构和 AI 驱动的生成模型,以编程方式生成合成数据,能够无缝集成到您的 AI 开发工作流中。

NeMo Curator 是一项可扩展的数据管护微服务,可帮助开发者整理 LLM 预训练所需的包含万亿个 Token 的多语言数据集。它由一组 API 形式的 Python 模组组成,这些模组利用 Dask、cuDF、cuGraph 和 Pytorch 将数据下载、文本提取、清理、筛选、完全匹配/模糊匹配去重和文本分类等数据管护任务扩展到数千个计算核心。

NeMo Customizer 是一项可扩展的高性能微服务,能够简化为特定领域用例定制的 LLM 的微调和对齐过程。

NeMo Auditor 可使用各种自动攻击和边缘用例提示,对 LLM 进行离线批量探测,以发现安全漏洞。它基于开放的 NVIDIA Garak 库构建,可接入评估工作流和 CI/CD 管线中,便于团队定期进行审核,并依据生成的报告持续强化模型与部署安全性。

NeMo Evaluator 为生成式 AI 应用提供可扩展的基准测试,涵盖 LLM、RAG 工作流和 AI 智能体。它提供开源 SDK,支持基于超过 100 种基准测试进行灵活实验,同时配备云原生微服务,可使用 LLM-as-a-judge 评分机制和专用性能指标,自动化实现企业级评估工作流。

NeMo Guardrails 使开发者能够为 LLM 和代理式 AI 应用配置可编程的安全护栏。该工具集成了 NVIDIA Nemotron Safety 模型,用于内容安全、PII、越狱检测和话题管控,具有先进的推理能力以及多语言和多模态支持。借助 NeMo Guardrails,企业可以控制智能体的数据访问权限、回复方式,以及可调用的工具与数据源,从而确保符合自定义策略要求并实现安全管控。

NeMo RL 是一个用于高级强化学习算法和可扩展的后训练的开源库,优化和调整企业级 AI 智能体。

NeMo Gym 是一个开源库,用于为大语言模型 (LLM) 构建强化学习 (RL) 训练环境。NeMo Gym 提供基础架构,用于开发环境、扩展部署集,并与您常用的训练框架无缝集成。它能够生成强化学习训练所需的数据,使 AI 智能体和模型具备该领域的专业技能。

NeMo Retriever 是一个开源库,搭载 Nemotron RAG 模型,用于构建可扩展的管道,从复杂文档中提取多模态数据。其多模态 PDF 提取的准确率提升高达 50%,速度提升至原来的 15 倍。

开源 NVIDIA NeMo Agent Toolkit 为生产级 AI 智能体系统提供与框架无关的分析、评估和优化。它捕获有关跨智能体协调、工具使用效率和计算成本的详细指标,通过 NVIDIA 加速计算实现数据驱动的优化。它可用于并行化缓慢的工作流程、缓存昂贵的操作,并在模型更新期间保持系统准确性。该工具包与 OpenTelemetry 和主要智能体框架兼容,可减少云支出,同时提供从单个智能体扩展到企业级数字工作者的见解。

NVIDIA NIM 是 NVIDIA AI Enterprise 的一部分,是一个易于使用的运行环境,专为在企业内加速部署生成式 AI 而设计。这项功能齐全的微服务支持各种 AI 模型,包括开源社区模型、NVIDIA AI Foundation 模型以及自定义 AI 模型。它以推理引擎为稳健基础,加速大规模无缝 AI 推理,确保可跨云端、数据中心和工作站部署 AI 应用。

检索增强生成 这项技术可将 LLM 连接到公司知识库,让 LLM 根据最新信息生成回复的技术。NeMo 可以搭配 Milvus、Llama Index 和 LangChain 等多种第三方工具和社区工具配合使用,从向量数据库中提取相关信息片段并将其提供给 LLM,从而以自然语言生成回复。浏览采用 RAG 工作流的 AI 聊天机器人页面,开始构建能够准确回答您的企业数据相关问题的生产级 AI 聊天机器人。

NVIDIA Blueprint 是使用 NVIDIA Nemotron 开放模型和库构建的综合参考工作流。每个蓝图均包含参考代码、部署工具、定制指南和参考架构,可加速 AI 智能体和数字孪生等 AI 解决方案从原型到生产的部署。

NVIDIA AI Enterprise 是一个端到端云原生软件平台,可加速数据科学工作流并简化生产级 AI 应用 (包括生成式 AI、计算机视觉、语音 AI 等) 的开发和部署。此平台不仅为 AI 从业者提供了业界领先的开发工具、框架、预训练模型和微服务,还配备了可靠的管理功能,以满足 IT 专业人员对性能、API 稳定性和安全性的需求。