NVIDIA NeMo™ 是一款用于管理 AI 智能体生命周期的模块化软件套件。它为数据处理、模型微调和评估、强化学习、策略执行和系统可观察性提供微服务和工具包。NeMo 可帮助企业在任何 GPU 加速的基础设施上大规模构建、监控和优化代理式 AI 系统。它与现有 AI 平台集成,支持云、本地和混合部署,使企业能够快速管理和轻松创建数据飞轮,不断优化 AI 智能体。
借助企业就绪、可互操作的软件套件,管理 AI 智能体的生命周期 (覆盖数据整理、定制和评估到安全护栏搭建、可观测性和性能优化) 。
轻松构建使用企业数据来改进 AI 智能体的数据飞轮,通过简单的 Helm 图表部署或针对工作流各个部分的 API 调用为整个飞轮的运行提供动力支持。
通过 GPU 加速的优化、多节点扩展和调优,最大化提升 AI 智能体的性能和吞吐量,从而实现经济高效的模型训练、部署和持续改进。
通过审核模型、为提示词设置安全护栏和漏洞持续扫描,构建更安全的代理式 AI 系统。
作为 NVIDIA AI Enterprise 的一部分,安全、优化的全栈解决方案可提供支持、安全保障和 API 稳定性,可直接部署到生产环境中。
从云和数据中心到边缘,随时随地构建、监测和优化 AI 智能体。
AI 智能体生命周期是一个端到端流程,用于在生产应用中开发和改进 AI 智能体。NVIDIA NeMo 提供支持此工作流每个步骤的工具,因此企业可以构建功能强大、安全且持续学习的智能体。
| 构建 | |
|---|---|
| 准备 AI 就绪型数据 将现有的多模态数据集处理为高质量、AI 就绪型格式,以用于开发流程,并生成合成数据以填补关键数据缺口。 |
|
| 选择合适的模型 选择或构建适合用例的模型,使用学术基准进行验证,运行自定义评估,并根据需要进行微调。 |
|
| 构建您的 AI 智能体 将您的自定义模型转变为可扩展的应用,将其无缝连接到您的企业堆栈和工具,并通过灵活的编排定义工作流。 |
|
| 部署 | |
| 部署具有出色性能的智能体 通过高吞吐量、低延迟推理优化生产智能体,确保其可以扩展以满足企业需求,并提供快速可靠的响应。 |
|
| 以数据为依据并加强保护 使用检索增强生成 (RAG) 将智能体响应固定在可信知识中,同时应用安全性、合规性和内容审核护栏。 |
|
| 优化 | |
| 监控并收集反馈 跟踪智能体在现实世界中与用户和其他系统的交互。系统评估其性能和准确性,寻找持续改进的机会。 |
|
| 借助数据飞轮不断改进 使用从监控中收集的反馈和数据创建数据驱动的飞轮,以迭代方式重新训练智能体,使其随着时间的推移不断优化并保持有效性。 |
|
用例
了解 NVIDIA NeMo 如何为行业用例提供支持,以及如何快速开始 AI 开发。
AI 智能体正在改变各行各业的客户服务,帮助公司加强客户对话,实现高分辨率,并提高人类代表的生产力。AI 智能体可以处理预测任务、推理和解决问题,接受培训以理解行业特定术语,并从组织的知识库中提取相关信息,而不管这些数据位于何处。
专门的代理式系统需要大量高质量的数据集,这些数据集从真实世界的来源收集起来既缓慢又昂贵。通过仿真或生成式 AI 模型创建的合成数据可以在没有隐私限制或质量问题的情况下创建无限的训练场景,从而消除这一瓶颈。这有助于更快地开发推理 LLM、多步骤决策者和多模态 AI 助手。
人们每年会生成数万亿个 PDF 文件,每个文件可能由多个页面组成,其中包含各种内容类型,包括文本、图像、图表和表格。这座数据“金矿”的开发速度取决于人类读取和理解的速度。但是,通过生成式 AI 和 RAG,可以使用这些未开发的数据获得业务洞察,帮助员工提高工作效率并降低成本。
生成式 AI 可基于企业的领域专业知识和专有 IP 生成高度相关、准确的定制化内容。
人形机器人可以快速适应以人类为中心的当前城市和工业工作空间,处理繁琐、重复或体力要求高的任务。它们的多功能性使它们可以应用于从工厂车间到医疗健康设施等多种环境,这些机器人可以协助人类,并通过自动化缓解劳动力短缺问题。
Apptronik
使用合适的工具和技术,将生成式 AI 模型从开发阶段向生产阶段推进。
使用合适的工具和技术,将生成式 AI 模型从开发阶段向生产阶段推进。
了解开始使用 NVIDIA NeMo 进行开发所需的所有资源,包括最新文档、教程、技术博客等。
与 NVIDIA 产品专家交流,了解如何借助 NVIDIA AI Enterprise 的安全性、API 稳定性和支持从试运行阶段向生产阶段推进。