NVIDIA Nemotron

适用于长期运行的 AI 智能体的高效、多模态、开放模型。

概览

什么是 NVIDIA Nemotron?

NVIDIA Nemotron™ 是一系列高效、多模态的 AI 开放模型,专为构建长时间运行的可自我进化的智能体而设计。Nemotron 模型专为快速完成任务而设计,在复杂智能体工作流中提供高推理吞吐量和领先的准确性。

凭借透明的训练数据和包括 NVIDIA RTX PRO™ 和 NVIDIA DGX Spark™ 在内的广泛的平台支持,Nemotron 模型可公开获取并集成到整个 AI 生态系统中,将可信赖的高性能的 AI 智能体部署到从边缘到云的各类环境。

借助 NVIDIA 企业软件平台构建未来工作模式

了解 NVIDIA 软件如何为长期运行的智能体提供支持,以处理工程、医疗健康和运营领域的复杂工作流程,从而提高员工生产力。

视频

NVIDIA 为什么打造 Nemotron

倾听 NVIDIA 应用深度学习研究副总裁 Bryan Catanzaro 的精彩讲述,了解 Nemotron 背后的愿景,以及为什么开放式技术对于构建值得信赖的企业就绪型 AI 至关重要。

优势

Nemotron 为代理式 AI 带来了什么?

开放模型

NVIDIA 的开放数据和优化技术可确保开发者和企业能够获得强大、透明且适应能力强的模型。模型和训练数据公开发布在 Hugging Face 上。

高计算效率

Nemotron 模型系列经过优化,能够以最高吞吐量和混合 MoE 架构更快地完成代理式任务。

高准确性

Nemotron 模型基于深厚的知识从零开始构建,经过高质量训练数据的后训练,并通过强化学习进行对齐,在长时间运行的代理式系统中实现了领先的准确性。

安全且简单的部署

Nemotron 模型系列以优化的 NVIDIA NIM™ 形式提供,可实现出色的推理性能和灵活的部署选项,确保更高的安全性、隐私性和可移植性。

模型

适用于不同工作负载的模型

Nemotron 模型擅长执行一系列代理式 AI 任务,包括推理、多模态视觉检索增强生成 (RAG)语音安全可用于实验的研究模型。

推理

Nemotron 模型支持一系列推理工作负载。Nano 为专业子智能体提供卓越的准确性和效率。Super 提供最高的准确性、高吞吐量推理和工具调用,可在多智能体系统上运行复杂任务。Ultra 为要求在多步骤工作流中发挥最大能力的任务关键型应用提供最佳推理。

视觉理解

多模态 Nemotron 模型在视频、音频、图像和文本处理方面提供最高的效率和领先的准确性,适用于企业代理式用例。它们针对专用的子智能体进行了优化,支持计算机使用智能体、文档智能以及视频和音频理解等功能。

语音

NVIDIA Nemotron 语音模型为代理式 AI 应用提供高吞吐量、超低延迟的自动语音识别 (ASR)、文本转语音 (TTS) 和神经网络机器翻译 (NMT)。

检索增强生成

Nemotron RAG 模型通过提取多模态结构化信息、生成高质量嵌入并对最相关的文档进行排序,实现快速、准确的文档理解。它们提供可扩展的高速检索功能,可提升 LLM 训练的数据质量、增强智能体和检索器性能,并简化文档工作流。

安全

NVIDIA Nemotron 安全模型提供实时防护有害内容、话题偏移和越狱尝试。它们添加了一个具有推理能力的多语言、多模态内容安全层,增强审核功能并确保文化一致性。

技术

适用于代理式 AI 的构建模块

开始使用 NVIDIA NeMo™ 构建和优化 AI 智能体以实现自定义代理式 AI,使用 NVIDIA NIM 实现快速的企业级部署,并使用 NVIDIA Blueprint 通过可定制的参考工作流加速开发。

NVIDIA NeMo

  • 构建、定制并部署生成式 AI 和代理式 AI。
  • 交付企业就绪大语言模型 (LLM),提供精确的数据管护、前沿定制、可扩展的数据采集、RAG 和加速性能。
  • 轻松构建数据飞轮,并利用最新信息持续优化 AI 智能体。

NVIDIA NIM

  • 加快部署性能经优化的生成式 AI 模型。
  • 借助稳定且安全的 API 运行您的业务应用,并获得企业级支持。

NVIDIA Blueprint

  • 利用企业深度研究和多模态 RAG 等生成式 AI 用例的参考应用,快速上手体验。
  • 利用蓝图加速开发,其中包括合作伙伴微服务、一个或多个 AI 智能体、参考代码、定制文档以及用于部署的 Helm 图表。

开始选项

Nemotron 入门指南

开始免费原型设计

从易于使用的 API 端点开始。

  • 访问全面加速的 AI 基础设施。
  • 确保数据不用于模型训练。
  • 无额度限制,轻松开启构建、测试和部署。

在推理服务提供商上运行 Nemotron

无需设置基础设施,在可信的第三方推理平台上即时部署 Nemotron 模型。

  • 部署时无需管理基础设施。
  • 从原型设计无缝扩展到生产。
  • 采用按需付费模式,优化成本。

联系我们

与 NVIDIA AI 专家交流,了解如何借助 NVIDIA AI Enterprise 提供的安全性、API 稳定性和支持,将试运行的生成式 AI 投入生产。

  • 了解您的生成式 AI 用例。
  • 讨论您的技术要求。
  • 根据您的目标和要求调整 NVIDIA AI 解决方案。

采用企业

使用 Nemotron 的企业

资源

了解 Nemotron 的最新动态

NVIDIA 为什么打造 Nemotron

了解 Nemotron 如何加速创新、为开发者赋能并塑造 AI 的未来。

ServiceNow 如何推动文档智能不断发展完善

了解如何使用 Nemotron 的模型权重、数据集和训练方法实现更深入的评估、ServiceNow 在视觉问答准确性方面的发现,以及开放性为什么对于多模态 AI 的持续改进至关重要。

开启/关闭推理功能:借助 AI 推理功能轻松搞定婚礼座位安排

看看具有 AI 推理功能的 LLM 如何跳出固有思维模式,在兼顾家庭关系和客人偏好的同时,给出婚礼座位安排解决方案。

常见问题解答

NVIDIA Nemotron 模型不仅是开放的,而且是真正开源的。NVIDIA 会发布训练数据集、技术和模型权重,以便开源社区能够从我们的经验成果中受益,并利用这些资源创建自己的模型。

NVIDIA 开放模型许可证是一个宽松的许可证,允许用户在不提及 NVIDIA 的情况下使用、修改、分发和商用模型部署和衍生工具许可,鼓励生成式 AI 的创新和进一步开发。

是的,您可以从 Hugging Face 免费下载 NVIDIA Nemotron 模型,并在生产环境中运行。

NVIDIA 也以 NVIDIA NIM 的形式提供 Nemotron 模型,以实现安全、可扩展的部署,但这需要 NVIDIA AI Enterprise 许可证。您可以试用 Nemotron 模型,并从 build.nvidia.com 下载 NIM。

是的,NVIDIA 致力于发布更多 Nemotron 模型、数据集和技术,以支持开源生态系统。

NVIDIA Nemotron 模型基于前沿开放模型构建,因此可以更快地构建更好的模型。此外,NVIDIA 还发布模型权重、训练数据集和训练技术,以便开发者社区可以使用 Nemotron 的这些不同部分来训练他们自己的模型。

NVIDIA 提供了多种工具,例如 NVIDIA Dynamo、TensorRT-LLM 和 NIM,用于在生产环境中大规模运行 Nemotron 模型。您也可以使用流行的开源库,例如 SGLang 和 vLLM。

后续步骤

准备好开始了吗?

使用合适的工具和技术,将 NVIDIA Nemotron 模型从开发阶段向生产阶段推进。

联系我们

与 NVIDIA 产品专家交流,了解如何借助 NVIDIA AI Enterprise 提供的安全性、API 稳定性和支持从试运行阶段向生产阶段推进。

及时了解 NVIDIA 代理式 AI 资讯

最新的代理式 AI 资讯、技术、突破性成果等内容将直接发送到您的收件箱,敬请关注。