NVIDIA Nemotron

开放、高效且适用于代理式 AI 的多模态模型。

概览

什么是 NVIDIA Nemotron?

NVIDIA Nemotron™ 是一系列开放模型、数据集和技术,可协助您构建高效、准确且专业的代理式 AI 系统。Nemotron 模型专为高级推理、编码、视觉理解、代理式任务、安全性和信息检索而设计,可公开获取并可在整个 AI 生态系统中集成,因此能够部署在边缘、云端等任意位置。

凭借透明的训练数据和广泛的平台支持,Nemotron 让创建和部署值得信赖的高性能 AI 智能体变得更加轻松。

公开的秘密:NVIDIA Nemotron 模型、数据集和技术如何推动 AI 发展

了解像 Nemotron 这样的开源 AI 技术如何提供企业成功采用 AI 所需的透明度和可信度。

NVIDIA 发布开放模型和数据,加速 AI 创新

NVIDIA Nemotron 开放模型、数据集和工具,让开发者能够构建高效、准确的专业代理式 AI,随时随地运行。

视频

NVIDIA 为什么打造 Nemotron

倾听 NVIDIA 应用深度学习研究副总裁 Bryan Catanzaro 的精彩讲述,了解 Nemotron 背后的愿景,以及为什么开放式技术对于构建值得信赖的企业就绪型 AI 至关重要。

优势

Nemotron 为代理式 AI 带来了什么?

开放模型

NVIDIA 的开放数据和优化技术可确保开发者和企业能够获得强大、透明且适应能力强的模型。模型和训练数据公开发布在 Hugging Face 上。

高计算效率

通过对更大的模型进行剪枝,Nemotron 系列经过优化,可实现更高的计算效率,并使用 NVIDIA TensorRT™-LLM 提供更高的吞吐量和支持在线 / 离线推理的能力。

高准确度

Nemotron 模型基于热门的开放推理模型构建,凭借其卓越的知识储备,使用高质量训练数据进行后训练,并像人类一样进行推理,在主流基准测试中实现了更高准确性。

安全、简单的部署

Nemotron 模型系列作为经过优化的 NVIDIA NIM™ 微服务,可提供出色的推理性能和灵活的部署选项,确保更高的安全性、隐私性和可移植性。

模型

适用于不同工作负载的推理模型

Nemotron 模型擅长执行一系列代理式 AI 任务,包括推理、视觉检索增强生成 (RAG) 和安全保障。研究模型也可用于实验。

推理

有一系列 Nemotron 推理模型可供选择:Nano 有助于实现超高的准确性,适用于 PC 和边缘设备;Super 有助于实现超高的准确性和吞吐量,可在单个 NVIDIA Tensor Core GPU 上运行;Ultra 有助于实现超高的准确性,适用于已针对多 GPU 数据中心进行优化的复杂系统。

检索增强生成

Nemotron 模型提供业界领先的提取、嵌入和重新排序功能,适用于构建检索工作流,将企业数据连接到智能代理系统,以便提供准确的实时业务洞察。

护栏

Nemotron SafetyGuard 模型可实时防范有害内容、离题漂移和越狱尝试。它们提供了一道额外的多语言内容安全屏障,有助于增强审核能力,并确保文化契合性。

技术

代理式 AI 的基础模组

开始使用用于自定义代理式 AI 的 NVIDIA NeMo™、用于快速企业就绪型部署的 NVIDIA NIM,以及用于通过可定制的参考工作流加速开发的 NVIDIA Blueprint 构建 AI 智能体。

NVIDIA NeMo

  • 构建、定制和部署生成式 AI 与代理式 AI。
  • 提供企业就绪型大语言模型 (LLM),这些模型具有精确的数据管护功能、先进的定制功能、可扩展的数据提取功能、RAG,以及加速的性能。
  • 轻松构建数据飞轮,并根据最新信息持续优化 AI 智能体。

NVIDIA NIM

  • 加速部署性能经过优化的生成式 AI 模型。
  • 依托稳定、安全且享受企业级支持的 API,轻松运行您的业务应用。

NVIDIA Blueprint

  • 我们针对企业深度研究、多模态 RAG 等生成式 AI 用例提供了参考应用,您可以借助这些资源快速上手。
  • 利用包括以下各项在内的蓝图,加快开发速度:合作伙伴微服务、一个或多个 AI 智能体、参考代码、定制文档,以及用于部署的 Helm 图表。

启动选项

Llama Nemotron 入门方法

开始免费原型设计

开始使用由 NVIDIA DGX™ Cloud 提供支持的、简单易用的 NIM API 端点。

  • 访问全面加速的 AI 基础设施。
  • 确保数据不用于模型训练。
  • 无预付,仅需简单的构建、测试和部署路径。

联系我们

与 NVIDIA AI 专家交流,了解如何借助 NVIDIA AI Enterprise 提供的安全性、API 稳定性和支持,将试运行的生成式 AI 投入生产。

  • 了解您的生成式 AI 用例。
  • 讨论您的技术要求。
  • 根据您的目标和要求调整 NVIDIA AI 解决方案。

采用者

使用 Nemotron 的企业

资源

了解 Nemotron 的最新信息

NVIDIA 为什么打造 Nemotron

了解 Nemotron 如何加速创新、为开发者赋能并塑造 AI 的未来。

ServiceNow 如何推动文档智能不断发展完善

了解如何使用 Nemotron 的模型权重、数据集和训练方法实现更深入的评估、ServiceNow 在视觉问答准确性方面的发现,以及开放性为什么对于多模态 AI 的持续改进至关重要。

开启/关闭推理功能:借助 AI 推理功能轻松搞定婚礼座位安排

看看具有 AI 推理功能的 LLM 如何跳出固有思维模式,在兼顾家庭关系和客人偏好的同时,给出婚礼座位安排解决方案。

NVIDIA 推出用于构建 AI Agent 平台的开放式推理模型系列

该系列经过 NVIDIA 的后训练,在 Llama 的基础上开发而成,并通过 DeepSeek-R1 进行模型蒸馏,探索这个系列并了解这些模型如何满足部署就绪型 AI 智能体的业务需求。

使用开放式 NVIDIA Llama Nemotron 模型构建先进的 AI 推理 Agents

了解 NVIDIA 是如何基于 Llama 开源模型开发出具备推理能力的 Llama Nemotron 模型家族的,以及又是如何利用 DeepSeek-R1 的推理专业技术对其进行后期训练的。

构建定制推理模型,实现高级代理式 AI 自主性

了解如何利用各种技术构建或定制推理模型,包括蒸馏和强化学习。

常见问题解答

NVIDIA Nemotron 模型不仅是开放的,更是真正意义上的开源模型。NVIDIA 发布训练数据集、技术和模型权重,以便开源社区既可以从我们的经验成果中受益,也可以利用这些资源创建自己的模型。

NVIDIA 开放模型许可是一项允许用户使用、修改、分发和商用部署模型和衍生工具的许可,无需向 NVIDIA 汇款,从而鼓励生成式 AI 的创新和进一步开发。

是的,您可以在生产环境中从 Hugging Face 下载和运行 NVIDIA Nemotron 模型。

NVIDIA 还提供 Nemotron 模型作为 NVIDIA NIM,以实现安全、可扩展的部署,这需要 NVIDIA AI Enterprise 许可证。您可以试用 Nemotron 模型,并从 nvidia.cn/ai 下载 NIM。

是的,NVIDIA 致力于发布更多 Nemotron 模型、数据集和技术,以支持开源生态系统。

NVIDIA Nemotron 模型基于前沿开放模型构建,因此可以更快地构建更好的模型。此外,NVIDIA 还发布模型权重、训练数据集和训练技术,以便开发者社区可以使用 Nemotron 的这些不同部分来训练自己的模型。

是的。NVIDIA 使用 NVIDIA 的开放数据集和神经网络架构搜索 (NAS) 等先进技术,在 Llama 模型系列的基础上构建了 Llama Nemotron 模型。Llama Nemotron 模型继承 Llama 母模型的使用许可。

NVIDIA 提供多种工具 (例如 NVIDIA Dynamo、TensorRT-LLM 和NIM) ,助力 Nemotron 模型实现大规模生产部署。你也可以使用主流开源库,例如 SGLang 和 vLLM。

后续步骤

准备好开始了吗?

使用合适的工具和技术,将 NVIDIA Nemotron 模型从开发阶段向生产阶段推进。

联系我们

与 NVIDIA 产品专家交流,了解如何借助 NVIDIA AI Enterprise 提供的安全性、API 稳定性和支持从试运行阶段向生产阶段推进。

及时了解 NVIDIA 代理式 AI 新闻

获取最新的代理式 AI 新闻、技术、突破等信息,直接发送到您的收件箱。