NVIDIA Nemotron

开放、高效且适用于代理式 AI 的多模态模型。

概览

什么是 NVIDIA Nemotron?

NVIDIA Nemotron™ 是一系列高效、开放、多模态的模型、数据集和技术,专为长时间运行的专业代理式 AI 系统而设计。Nemotron 模型专为高级推理、编码、视觉理解、安全、语音和信息检索而设计,帮助智能体以低成本和领先的准确性更快地完成复杂任务。

凭借透明的训练数据和广泛的平台支持 (包括 NVIDIA RTX PRO™ 和 NVIDIA DGX Spark™),Nemotron 模型可公开获取并集成到整个 AI 生态系统中,从而能够将可信赖的高性能 AI 智能体部署到从边缘到云的任何位置。

NVIDIA 推出面向多模态子智能体的 Nemotron 3 Nano Omni

了解这款全新的开放式多模态模型,它将视频、音频、图像和文本理解统一到一个推理闭环中,取代了碎片化模型堆叠,并使智能体能够以更少的算力、更快速度完成任务。

Nemotron 3 Nano Omni:面向代理式 AI 的开放式 Omni 推理模型

了解 Nemotron 3 Nano Omni 如何以低计算量实现领先的效率和准确性。探索架构和训练方法,并访问开放式数据集、方法、操作手册等内容,开始构建代理式 AI 系统。

视频

NVIDIA 为什么打造 Nemotron

倾听 NVIDIA 应用深度学习研究副总裁 Bryan Catanzaro 的精彩讲述,了解 Nemotron 背后的愿景,以及为什么开放式技术对于构建值得信赖的企业就绪型 AI 至关重要。

优势

Nemotron 为代理式 AI 带来了什么?

开放模型

NVIDIA 的开放数据和优化技术可确保开发者和企业能够获得强大、透明且适应能力强的模型。模型和训练数据公开发布在 Hugging Face 上。

高计算效率

Nemotron 模型系列经过优化,能够以最高吞吐量和混合 MoE 架构更快地完成代理式任务。

高准确度

Nemotron 模型基于深厚的知识从零开始构建,经过高质量训练数据的后训练,并通过强化学习进行对齐,在长时间运行的代理式系统中实现了领先的准确性。

安全、简单的部署

Nemotron 模型系列作为经过优化的 NVIDIA NIM™,可提供出色的推理性能和灵活的部署选项,确保更高的安全性、隐私性和可移植性。

模型

适用于不同工作负载的推理模型

Nemotron 模型擅长执行一系列代理式 AI 任务,包括推理、多模态视觉、检索增强生成 (RAG)语音安全。可用于实验的研究模型。

推理

Nemotron 模型支持一系列推理工作负载。Nano 为专业子智能体提供卓越的准确性和效率。Super 提供最高的准确性、高吞吐量推理和工具调用,可在多智能体系统上运行复杂任务。Ultra 为要求在多步骤工作流中发挥最大能力的任务关键型应用提供最佳推理。

视觉理解

多模态 Nemotron 模型在视频、音频、图像和文本处理方面提供最高的效率和领先的准确性,适用于企业代理式用例。它们针对专用的子智能体进行了优化,支持计算机使用智能体、文档智能以及视频和音频理解等功能。

语音

NVIDIA Nemotron 语音模型为代理式 AI 应用提供高吞吐量、超低延迟的自动语音识别 (ASR)、文本转语音 (TTS) 和神经网络机器翻译 (NMT)。

检索增强生成

Nemotron 模型提供业界领先的提取、嵌入和重新排序功能,适用于构建检索工作流,将企业数据连接到智能代理系统,以便提供准确的实时业务洞察。

安全性

NVIDIA Nemotron 安全模型可针对有害内容、离题漂移和越狱企图提供实时保护。它们添加了具有推理功能的多语种、多模态内容安全层,从而增强节制并确保文化对齐。

技术

代理式 AI 的基础模组

开始使用用于自定义代理式 AI 的 NVIDIA NeMo™、用于快速企业就绪型部署的 NVIDIA NIM,以及用于通过可定制的参考工作流加速开发的 NVIDIA Blueprint 构建 AI 智能体。

NVIDIA NeMo

  • 构建、定制和部署生成式 AI 与代理式 AI。
  • 提供企业就绪型大语言模型 (LLM),这些模型具有精确的数据管护功能、先进的定制功能、可扩展的数据提取功能、RAG,以及加速的性能。
  • 轻松构建数据飞轮,并根据最新信息持续优化 AI 智能体。

NVIDIA NIM

  • 加速部署性能经过优化的生成式 AI 模型。
  • 依托稳定、安全且享受企业级支持的 API,轻松运行您的业务应用。

NVIDIA Blueprint

  • 我们针对企业深度研究、多模态 RAG 等生成式 AI 用例提供了参考应用,您可以借助这些资源快速上手。
  • 利用包括以下各项在内的蓝图,加快开发速度:合作伙伴微服务、一个或多个 AI 智能体、参考代码、定制文档,以及用于部署的 Helm 图表。

启动选项

Llama Nemotron 入门方法

开始免费原型设计

使用易于使用的 API 端点开始使用。

  • 访问加速的 AI 基础设施。
  • 确保数据不用于模型训练。
  • 无预付,仅需简单的构建、测试和部署路径。

在推理服务提供商上运行 Nemotron

无需设置基础设施,即可在可信的第三方推理平台上即时部署 Nemotron 模型。

  • 部署时无需管理基础设施。
  • 无缝扩展,从原型到生产。
  • 基于使用情况的定价,优化成本。

联系我们

与 NVIDIA AI 专家交流,了解如何借助 NVIDIA AI Enterprise 提供的安全性、API 稳定性和支持,将试运行的生成式 AI 投入生产。

  • 了解您的生成式 AI 用例。
  • 讨论您的技术要求。
  • 根据您的目标和要求调整 NVIDIA AI 解决方案。

采用者

使用 Nemotron 的企业

资源

了解 Nemotron 的最新信息

NVIDIA 为什么打造 Nemotron

了解 Nemotron 如何加速创新、为开发者赋能并塑造 AI 的未来。

ServiceNow 如何推动文档智能不断发展完善

了解如何使用 Nemotron 的模型权重、数据集和训练方法实现更深入的评估、ServiceNow 在视觉问答准确性方面的发现,以及开放性为什么对于多模态 AI 的持续改进至关重要。

开启/关闭推理功能:借助 AI 推理功能轻松搞定婚礼座位安排

看看具有 AI 推理功能的 LLM 如何跳出固有思维模式,在兼顾家庭关系和客人偏好的同时,给出婚礼座位安排解决方案。

NVIDIA 推出用于构建 AI 智能体平台的开放式推理模型系列

该系列经过 NVIDIA 的后训练,在 Llama 的基础上开发而成,并通过 DeepSeek-R1 进行模型蒸馏,探索这个系列并了解这些模型如何满足部署就绪型 AI 智能体的业务需求。

使用开放式 NVIDIA Llama Nemotron 模型构建先进的 AI 推理智能体

了解 NVIDIA 是如何基于 Llama 开源模型开发出具备推理能力的 Llama Nemotron 模型家族的,以及又是如何利用 DeepSeek-R1 的推理专业技术对其进行后期训练的。

构建定制推理模型,实现高级代理式 AI 自主性

了解如何利用各种技术构建或定制推理模型,包括蒸馏和强化学习。

Nemotron 常见问题解答

NVIDIA Nemotron 模型不仅是开放的,更是真正意义上的开源模型。NVIDIA 发布训练数据集、技术和模型权重,以便开源社区既可以从我们的经验成果中受益,也可以利用这些资源创建自己的模型。

NVIDIA 开放模型许可是一项允许用户不需注明 NVIDIA 的情况下使用、修改、分发和商用部署模型和衍生工具的许可,从而鼓励生成式 AI 的创新和进一步开发。

是的,您可以在生产环境中从 Hugging Face 下载和运行 NVIDIA Nemotron 模型。

NVIDIA 还提供 Nemotron 模型作为 NVIDIA NIM,以实现安全、可扩展的部署,这需要 NVIDIA AI Enterprise 许可证。您可以试用 Nemotron 模型,并从 nvidia.cn/ai 下载 NIM。

是的,NVIDIA 致力于发布更多 Nemotron 模型、数据集和技术,以支持开源生态系统。

NVIDIA Nemotron 模型基于前沿开放模型构建,因此可以更快地构建更好的模型。此外,NVIDIA 还发布模型权重、训练数据集和训练技术,以便开发者社区可以使用 Nemotron 的这些不同部分来训练自己的模型。

是的。NVIDIA 使用 NVIDIA 的开放数据集和神经网络架构搜索 (NAS) 等先进技术,在 Llama 模型系列的基础上构建了 Llama Nemotron 模型。Llama Nemotron 模型继承 Llama 母模型的使用许可。

NVIDIA 提供多种工具,例如 NVIDIA Dynamo、TensorRT-LLM 和 NIM,助力 Nemotron 模型实现大规模生产部署。您也可以使用主流开源库,例如 SGLang 和 vLLM。

后续步骤

准备好开始了吗?

使用合适的工具和技术,将 NVIDIA Nemotron 模型从开发阶段向生产阶段推进。

联系我们

与 NVIDIA 产品专家交流,了解如何借助 NVIDIA AI Enterprise 提供的安全性、API 稳定性和支持从试运行阶段向生产阶段推进。

及时了解 NVIDIA 代理式 AI 新闻

获取最新的代理式 AI 新闻、技术、突破等信息,直接发送到您的收件箱。