NVIDIA NetQ

将全面可视化、故障排除和 DevOps 引入到现代数据中心网络中。

通过注册来试用 NetQ SaaS (1 年) 或本地部署 (90 天) 。

采用 NetQ 的网络操作

NVIDIA NetQ™ 是一款高度可扩展的现代网络运营工具集,可让您实时提供 Cumulus 网络架构的可见性,并进行故障排除和验证。NetQ 利用遥测技术来提供有关数据中心网络运行状况的可行见解,确保您的 AI 网络架构得以平稳运行。

NetQ 工作原理

使用交换机和主机上的代理,NetQ 能够在整个网络中收集遥测数据。

作为中心控制点,NetQ 可存储和处理信息,以提供可操作的见解和完整的可见性。

丰富的 GUI 通过快速突出问题和警报来简化操作并提高效率。

为什么选择 NetQ 进行网络操作?

NetQ 支持 NVIDIA What Just Happened® (故障快照) 用于硬件加速检测和报告数据平面异常和间歇性网络问题。

NetQ 还提供安全的云服务,从而更轻松地安装、部署和扩展网络。利用 NetQ 基于云的部署,可提供即时升级、零维护和更少的设备管理工作。

简化升级

通过 NetQ 直观的 GUI,体验网络管理的轻松简易。

获取实时情报

关联配置和运营状态,并即时识别和跟踪整个数据中心的状态变化。

减少宕机时间

通过快速警报、更快的故障排除和主动检测来优化 AI 运营。

更快地修复

检测有故障的网络状态,并获取包含精确故障位置数据的警报。

消除复杂性

通过可视化和警报快速突出显示问题,简化操作并提高操作员效率。

诊断根本原因

跟踪网络路径,重放过去任何时候的网络状态,查看全结构事件更改日志,并诊断状态偏差的根本原因。

NetQ 的功能

借助完整的持续集成和持续部署 (CI/CD) 功能,NetQ 可以轻松管理和配置 AI 网络架构中的网络元素,并提供全套的运营功能,例如可见性、故障排除、验证、跟踪和比较 look-back 功能。

Key Features

  • 网络管理:只需按一下按钮,即可访问强大的工具来管理您的 NVIDIA Cumulus Linux™ 环境。
  • 高级遥测:实时数据收集,可通过单个图形用户界面 (GUI) 进行深度故障排除、可视化和自动工作流程。
  • 快照和比较:轻松将以前的网络配置与更改后的网络配置进行比较,以消除中断风险。
  • 全网可视化:通过 NetQ 丰富的 GUI 查看有关网络运行状况的实时可视化。
  • 数据流遥测:分析网络架构范围内匹配 4 元组或 5 元组数据流所有路径的网络延迟和缓冲区占用数据来识别拥塞点。
  • 预防性验证:在投入生产之前减少手动错误。
  • 诊断故障排除:使用先进的诊断工具诊断出现状态偏差的根本原因。
  • gNMI 收集:使用 gRPC 网络管理接口 (gNMI) 规范从 NetQ 代理传输 WJH 遥测数据。
  • RoCE 支持:使用 NetQ 监控基于融合以太网的远程直接内存访问 (RoCE) 环境,以获得有关 AI 网络架构的可行见解。

详细了解 NetQ

NVIDIA NetQ 数据表

了解 NetQ 的特性和优势,这是一种现代操作工具,可实现数据中心网络的全面、实时可视化和故障排除。

网络可视化的未来

阅读新的策略和指标、网络警报、工具等。

NetQ 命令速查手册

使用此速查手册可快速学习和参考操作 NetQ 的命令。

有兴趣免费体验 NetQ 吗?