This site requires Javascript in order to view all its content. Please enable Javascript in order to access all the functionality of this web site. Here are the instructions how to enable JavaScript in your web browser.

NVIDIA Nemotron

开放、高效且适用于代理式 AI 的多模态模型。

博客 | 面向开发者

概览
视频
优势
模型
技术
采用者
资源
常见问题解答
后续步骤

概览
视频
优势
模型
技术
采用者
资源
常见问题解答
后续步骤

概览

什么是 NVIDIA Nemotron？

NVIDIA Nemotron™ 是一系列开放模型、数据集和技术，可协助您构建高效、准确且专业的代理式 AI 系统。Nemotron 模型专为高级推理、编码、视觉理解、代理式任务、安全性和信息检索而设计，可公开获取并可在整个 AI 生态系统中集成，因此能够部署在边缘、云端等任意位置。

借助透明的训练数据和广泛的平台支持，包括 NVIDIA RTX PRO 和 NVIDIA DGX Spark™，Nemotron 可以更轻松地创建和部署值得信赖的高性能 AI 智能体。

共同创造未来：了解 Nemotron 联盟

Mistral AI、Black Forest Labs、Thinking Machines Lab、Reflection AI、Cursor、LangChain、Sarvam 和 Perplexity 携手打造下一个开放前沿模型。

阅读新闻稿

NVIDIA 扩展面向代理式 AI 和物理 AI 的开放模型

全新开放模型为 AI 智能体、机器人物理 AI 和医疗健康研究提供支持。

阅读新闻稿

视频

NVIDIA 为什么打造 Nemotron

倾听 NVIDIA 应用深度学习研究副总裁 Bryan Catanzaro 的精彩讲述，了解 Nemotron 背后的愿景，以及为什么开放式技术对于构建值得信赖的企业就绪型 AI 至关重要。

观看视频 (03:41)

优势

Nemotron 为代理式 AI 带来了什么？

开放模型

NVIDIA 的开放数据和优化技术可确保开发者和企业能够获得强大、透明且适应能力强的模型。模型和训练数据公开发布在 Hugging Face 上。

高计算效率

通过对更大的模型进行剪枝，Nemotron 系列经过优化，可实现更高的计算效率，并使用 NVIDIA TensorRT™-LLM 提供更高的吞吐量和支持在线 / 离线推理的能力。

高准确度

Nemotron 模型基于热门的开放推理模型构建，凭借其卓越的知识储备，使用高质量训练数据进行后训练，并像人类一样进行推理，在主流基准测试中实现了更高准确性。

安全、简单的部署

Nemotron 模型系列作为经过优化的 NVIDIA NIM™ 微服务，可提供出色的推理性能和灵活的部署选项，确保更高的安全性、隐私性和可移植性。

模型

适用于不同工作负载的推理模型

Nemotron 模型在推理、视觉、检索增强生成 (RAG) 、语音和安全等一系列代理式 AI 任务中表现出色。研究模型也可用于实验。

推理

有一系列 Nemotron 推理模型可供选择：Nano 有助于实现超高的准确性，适用于 PC 和边缘设备；Super 有助于实现超高的准确性和吞吐量，可在单个 NVIDIA Tensor Core GPU 上运行；Ultra 有助于实现超高的准确性，适用于已针对多 GPU 数据中心进行优化的复杂系统。

视觉理解

Nemotron 模型在多图像推理和视频理解方面具有领先的准确性，具有强大的文档智能、视觉问答和摘要功能。

使用 NVIDIA Nemotron Parse 提取文档数据，然后使用 NVIDIA Nemotron 2 Nano VL 将文本内容与图表、图表和其他视觉效果关联起来，以实现智能查询。

语音

NVIDIA Nemotron 语音模型为代理式 AI 应用提供高吞吐量、超低延迟的自动语音识别 (ASR) 、文本转语音 (TTS) 和神经网络机器翻译 (NMT) 。

检索增强生成

Nemotron 模型提供业界领先的提取、嵌入和重新排序功能，适用于构建检索工作流，将企业数据连接到智能代理系统，以便提供准确的实时业务洞察。

安全性

NVIDIA Nemotron 安全模型可针对有害内容、离题漂移和越狱企图提供实时保护。它们添加了具有推理功能的多语种、多模态内容安全层，从而增强节制并确保文化对齐。

查看所有 Nemotron 模型

技术

代理式 AI 的基础模组

开始使用用于自定义代理式 AI 的 NVIDIA NeMo™、用于快速企业就绪型部署的 NVIDIA NIM，以及用于通过可定制的参考工作流加速开发的 NVIDIA Blueprint 构建 AI 智能体。

NVIDIA NeMo

构建、定制和部署生成式 AI 与代理式 AI。
提供企业就绪型大语言模型 (LLM)，这些模型具有精确的数据管护功能、先进的定制功能、可扩展的数据提取功能、RAG，以及加速的性能。
轻松构建数据飞轮，并根据最新信息持续优化 AI 智能体。

开始使用 NeMo

NVIDIA NIM

加速部署性能经过优化的生成式 AI 模型。
依托稳定、安全且享受企业级支持的 API，轻松运行您的业务应用。

开始使用 NIM

NVIDIA Blueprint

我们针对企业深度研究、多模态 RAG 等生成式 AI 用例提供了参考应用，您可以借助这些资源快速上手。
利用包括以下各项在内的蓝图，加快开发速度：合作伙伴微服务、一个或多个 AI 智能体、参考代码、定制文档，以及用于部署的 Helm 图表。

开始使用蓝图

启动选项

Llama Nemotron 入门方法

开始免费原型设计

使用易于使用的 API 端点开始使用。

访问加速的 AI 基础设施。
确保数据不用于模型训练。
无预付，仅需简单的构建、测试和部署路径。

在推理服务提供商上运行 Nemotron

无需设置基础设施，即可在可信的第三方推理平台上即时部署 Nemotron 模型。

部署时无需管理基础设施。
无缝扩展，从原型到生产。
基于使用情况的定价，优化成本。

探索推理提供商

联系我们

与 NVIDIA AI 专家交流，了解如何借助 NVIDIA AI Enterprise 提供的安全性、API 稳定性和支持，将试运行的生成式 AI 投入生产。

了解您的生成式 AI 用例。
讨论您的技术要求。
根据您的目标和要求调整 NVIDIA AI 解决方案。

联系销售顾问

采用者

使用 Nemotron 的企业

资源

了解 Nemotron 的最新信息

博客
会议
视频

查看所有技术博客查看所有主题新闻

查看所有会议

NVIDIA 为什么打造 Nemotron

了解 Nemotron 如何加速创新、为开发者赋能并塑造 AI 的未来。

ServiceNow 如何推动文档智能不断发展完善

了解如何使用 Nemotron 的模型权重、数据集和训练方法实现更深入的评估、ServiceNow 在视觉问答准确性方面的发现，以及开放性为什么对于多模态 AI 的持续改进至关重要。

开启/关闭推理功能：借助 AI 推理功能轻松搞定婚礼座位安排

看看具有 AI 推理功能的 LLM 如何跳出固有思维模式，在兼顾家庭关系和客人偏好的同时，给出婚礼座位安排解决方案。

NVIDIA 推出用于构建 AI Agent 平台的开放式推理模型系列

该系列经过 NVIDIA 的后训练，在 Llama 的基础上开发而成，并通过 DeepSeek-R1 进行模型蒸馏，探索这个系列并了解这些模型如何满足部署就绪型 AI 智能体的业务需求。

使用开放式 NVIDIA Llama Nemotron 模型构建先进的 AI 推理 Agents

了解 NVIDIA 是如何基于 Llama 开源模型开发出具备推理能力的 Llama Nemotron 模型家族的，以及又是如何利用 DeepSeek-R1 的推理专业技术对其进行后期训练的。

构建定制推理模型，实现高级代理式 AI 自主性

了解如何利用各种技术构建或定制推理模型，包括蒸馏和强化学习。

Nemotron 常见问题解答

NVIDIA Nemotron 模型不仅是开放的，更是真正意义上的开源模型。NVIDIA 发布训练数据集、技术和模型权重，以便开源社区既可以从我们的经验成果中受益，也可以利用这些资源创建自己的模型。

NVIDIA 开放模型许可是一项允许用户使用、修改、分发和商用部署模型和衍生工具的许可，无需向 NVIDIA 汇款，从而鼓励生成式 AI 的创新和进一步开发。

是的，您可以在生产环境中从 Hugging Face 下载和运行 NVIDIA Nemotron 模型。

NVIDIA 还提供 Nemotron 模型作为 NVIDIA NIM，以实现安全、可扩展的部署，这需要 NVIDIA AI Enterprise 许可证。您可以试用 Nemotron 模型，并从 nvidia.cn/ai 下载 NIM。

是的，NVIDIA 致力于发布更多 Nemotron 模型、数据集和技术，以支持开源生态系统。

NVIDIA Nemotron 模型基于前沿开放模型构建，因此可以更快地构建更好的模型。此外，NVIDIA 还发布模型权重、训练数据集和训练技术，以便开发者社区可以使用 Nemotron 的这些不同部分来训练自己的模型。

是的。NVIDIA 使用 NVIDIA 的开放数据集和神经网络架构搜索 (NAS) 等先进技术，在 Llama 模型系列的基础上构建了 Llama Nemotron 模型。Llama Nemotron 模型继承 Llama 母模型的使用许可。

NVIDIA 提供多种工具 (例如 NVIDIA Dynamo、TensorRT-LLM 和NIM) ，助力 Nemotron 模型实现大规模生产部署。你也可以使用主流开源库，例如 SGLang 和 vLLM。

后续步骤

准备好开始了吗？

使用合适的工具和技术，将 NVIDIA Nemotron 模型从开发阶段向生产阶段推进。

联系我们

与 NVIDIA 产品专家交流，了解如何借助 NVIDIA AI Enterprise 提供的安全性、API 稳定性和支持从试运行阶段向生产阶段推进。

及时了解 NVIDIA 代理式 AI 新闻

获取最新的代理式 AI 新闻、技术、突破等信息，直接发送到您的收件箱。

随时了解最新情况