NVIDIA-Certified Professional

AI Networking

(NCP-AIN)

关于认证

NVIDIA-Certified Professional: AI Networking (NCP-AIN) 认证,用于验证利用 NVIDIA 先进的网络技术部署和配置环境的能力。包含 70 – 75 道选择题,考试时长 120 分钟。


请在预约考试之前仔细阅读 NVIDIA 考试规则

如有问题,请将详情发邮件至 dlichina@nvidia.com

考试概况

考试时长:120 分钟

考试费用:2880 元

认证等级:Professional

认证主题:AI Networking

题目数量:70 – 75 道选择题

预备知识:两到三年使用 NVIDIA 硬件解决方案运营数据中心的经验。能够部署数据中心基础设施的各种组件以支持 AI 工作负载。

考试语言:可选中文或英文

认证有效期:认证自颁发之日起两年内有效。可以通过重新参加考试保持认证资质。

NVIDIA 认证证书:通过考试后,您将获得数字徽章和电子证书(其中包含认证主题和级别,并可在线验证核实),并将被收录于 NVIDIA 认证名录中。

 

选择考试

考试涵盖主题

  • AI 数据中心设计与优化
  • NVIDIA Spectrum 网络
  • NVIDIA InfiniBand 网络
  • Kubernetes 集成
  • 故障排除工具
  • 自动化与配置

适用人群

  • 数据中心管理员
  • 基础设施管理员
  • 网络管理员
  • 网络工程师
  • 存储管理员
  • 系统管理员
  • 解决方案架构师

推荐培训 (可选)

借助 NVIDIA UFM 轻松管理数据中心

在线自主培训课程,通过一系列交互式学习单元、视频和模拟器,学习 NVIDIA® UFM® 及其功能、优势和组件。

BlueField DPU 管理

在线自主培训课程,学习数据中心加速计算平台 BlueField® 的数据处理单元的基础概念。掌握运行 BlueField 数据处理单元的基础技能,用以开发加速数据中心服务的应用。

RDMA 编程基础知识

该在线课程提供创新的培训形式,包括重点突出的短视频、互动测验和实战练习,掌握 RDMA 应用编程的技术。

Cumulus Linux 公开训练营

讲师指导的远程直播在线培训,探讨在 NVIDIA 交换机上运行的 Cumulus Linux 的架构、安装、配置、运营和管理。

InfiniBand 网络管理

在线自主培训课程,介绍 InfiniBand 规范,涵盖理论和实践两个方面。满足对 InfiniBand 网络进行安装、配置、管理、故障排查或监控的 IT 专业人士的需求。

Spectrum-X 网络平台管理公开训练营

讲师指导的远程直播在线培训,探讨适用于 AI 工厂的 NVIDIA Spectrum-X 网络平台的架构、部署、配置、运营和管理。

考前学习指南

查看学习指南,详细了解考试所涵盖的各项技术主题的介绍和权重,以及考点相关的培训课程和阅读资料。

考试大纲

根据考试涵盖的各项技术,您可以选择学习相关的 NVIDIA 培训课程,以更加充分地准备考试。

认证主题 考试权重 涵盖的技术
AI 数据中心设计与优化 5%
  • 描述 AI 工厂网络架构及其组件 (如 GPU、BlueField、可扩展单元 SU、交换机)
  • 描述高性能 AI 工作负载的轨道优化拓扑结构
  • 描述 GPU 间的通信方式
NVIDIA Spectrum 网络 30%
  • 配置 NVIDIA Spectrum-X 交换机,支持 RoCE (基于以太网的 RDMA),实现高速、低延迟通信
  • 启用并验证服务质量 (QoS)、ECN、PFC,高级功能 (如自适应路由) 以及遥测
  • 配置多租户 BGP-EVPN,实现租户工作负载隔离
  • 使用 NVIDIA Air 模拟网络环境并识别潜在问题
  • 使用带内遥测和 NVIDIA® What Just Happened® (WJH) 服务诊断拥塞或丢包
  • 使用 NetQ™ 进行实时网络监控,包括拥塞检测和延迟测量
  • 安装 DOCA™
  • 配置 SuperNIC™ 功能,实现高级报文处理和拥塞控制
NVIDIA InfiniBand 网络 30%
  • 执行初始配置和资源部署,包括高可用性 (HA)
  • 配置分区键 (PKeys),确保 InfiniBand 网络多租户的安全
  • 配置 QoS 和自适应路由,根据拥塞动态调整路径
  • 使用 UFM 监控 InfiniBand 链路状态和带宽利用率
Kubernetes 集成 5%
  • 部署 NVIDIA Network Operator,管理 Kubernetes 集群中的 RDMA 接口和 InfiniBand 网络
  • 验证 NVIDIA Network Operator 功能
故障排除工具 20%
  • 使用工具 (如 cl-resource-query) 检查 Spectrum-X 环境中的资源分配
  • 使用 WJH 服务进行实时事件分析
  • 验证 GPU、CPU 和存储系统之间的低延迟互连
  • 使用 UFM 系统健康功能排查 InfiniBand 故障
  • 使用 ib_write_lat、ib_write_bw、ibping、ibstat、ibdiagnet、ibnodes 和 iblinkinfo 等命令排查连接故障
自动化和配置 10%
  • 通过 NVUE 模板管理 Spectrum-X 交换机配置
  • 写 Ansible Playbook 自动化网络设置任务,如 VLAN 创建或 RoCE 配置

联系我们

NVIDIA提供培训和 AI 专业认证,助力专业人士提升在生成式 AI 与大语言模型、深度学习、加速计算、数据科学、图形与仿真等领域的技能和知识。

咨询 NVIDIA 培训和认证,请将需求详情发邮件至 dlichina@nvidia.com

订阅 NVIDIA 培训最新消息

想要获取最新的 DLI 课程、培训班或优惠活动,请填写如下表格。请了解,您也可以随时取消此订阅。请收藏 DLI 中文官网 nvidia.cn/training,以便随时查看或学习课程。