NVIDIA NeMo

一款全面的套件，用于在企业级 AI 智能体的整个生命周期中构建、监控和优化。

开始使用

文档

概览
优势
特性
用例
启动选项
客户案例
采用者
资源
后续步骤

概览
优势
特性
用例
启动选项
客户案例
采用者
资源
后续步骤

入门指南

概览

NVIDIA NeMo 是什么？

NVIDIA NeMo™ 是一个用于管理 AI 智能体生命周期的综合工具套件。它包含用于数据处理、数据生成、模型微调和评估、强化学习、语音、安全性及智能体可观测性的开放库和微服务。使用 NeMo 自定义 NVIDIA Nemotron™ 和其他模型，构建面向您的专业领域需求和数据的生产级专用智能体系统。

可与现有 AI 平台集成，并支持云、本地和混合部署。

NVIDIA 数据飞轮蓝图

该 AI 蓝图使开发者能够构建一个自动数据飞轮，捕获真实使用数据，以持续提高生成式 AI 和代理式 AI 应用的准确性和效率。

了解详情

NVIDIA AI-Q 蓝图

构建自定义企业研究智能体的参考工作流，可安全连接企业数据、工具和工作流，基于企业内部知识库提供准确且具备上下文感知能力的洞察。

了解详情

特性

用于管理 AI 智能体生命周期的工具

AI 智能体生命周期是一个端到端流程，用于在生产应用中开发和改进 AI 智能体。NVIDIA NeMo 提供支持此工作流每个步骤的工具，因此企业可以构建功能强大、安全且持续学习的专用智能体。

构建
准备 AI 就绪型数据将现有的多模态数据集处理为高质量、AI 就绪型格式，以用于开发流程，并生成合成数据以填补关键数据缺口。	NeMo Curator 为智能体应用场景与模型训练，完成多模态数据的清洗、过滤和安全预处理。 NeMo Data Designer 从零创建创建面向特定领域的合成数据集，用于构建与评估专用智能体。
选择合适的模型选择或构建适合业务场景的模型：从开放的 Nemotron 模型、其他开放或专有模型中进行选择，也可以从零开始训练。通过评估流程完成验证，并根据需要进行微调。	NVIDIA Nemotron 用于推理、RAG、语音、视觉和安全的先进 NVIDIA 开放模型。 NeMo Retriever 构建可扩展的流程，从复杂文档中提取文本、表格、图表和图像。 NeMo Evaluator 通过学术评测、大模型自动评判与自定义评估方案，对模型和智能体进行基准测试与验证。
构建您的 AI 智能体跨框架对智能体工作流进行性能分析和优化，内置的性能分析、瓶颈检测、基于评估的 RL 调优能力，并与 LangChain、LlamaIndex 等智能体生态系统的兼容。	NeMo Agent Toolkit 一款与框架无关的开源库，用于构建、分析与优化 AI 智能体。
部署
部署具有出色性能的智能体通过高吞吐量、低延迟推理优化生产智能体，确保其可以扩展以满足企业需求，并提供快速可靠的响应。	NVIDIA NIM 在经过优化的容器中运行 AI 模型，这些容器以兼容 OpenAI 的 API 形式公开。
以数据为基础并应用防护措施使用检索增强生成 (RAG) 将智能体响应固定在可信知识中，同时应用安全性、合规性和内容审核护栏。	NeMo Retriever 构建准确、隐私保护的 RAG 工作流。 NeMo Guardrails 在 AI 交互中加强安全性、合规性和可控性。
优化
监控并收集反馈跟踪智能体在现实世界中与用户和其他系统的交互。系统评估其性能和准确性，寻找持续改进的机会。	NeMo Agent Toolkit 一款与框架无关的开源库，用于构建、分析与优化 AI 智能体。 NeMo Customizer 根据领域数据对模型进行微调和对齐的微服务。 NeMo 框架 NeMo 完整开源库，用于大规模高效训练和对齐 LLM 和多模态模型。
借助数据飞轮不断改进使用从监控中收集的反馈和数据创建数据驱动的飞轮，以迭代方式重新训练智能体，使其随着时间的推移不断优化并保持有效性。	NeMo RL 使用先进的强化学习 (RL) 技术大规模地对模型进行后训练和对齐。 NeMo Gym 模拟 RL 训练环境，生成高质量的代理式 RL 训练数据或运行轨迹。 NeMo Evaluator 通过学术评测、大模型自动评判与自定义评估方案，对模型和智能体进行基准测试与验证。 NeMo Customizer 根据领域数据对模型进行微调和对齐的微服务。