面向 AI 和高性能计算的集群管理软件。
概览
NVIDIA Base Command™ Manager 为边缘、数据中心、多云和混合云环境中的异构 AI 和高性能计算 (HPC) 集群提供快速部署和端到端管理。它能够自动调配和管理各种规模 ,包括从几个节点到数十万个节点 的集群,支持 NVIDIA Blackwell 架构和其他系统,并支持使用 Kubernetes 进行编排。
优势
技术
NVIDIA Base Command Manager 11 完全集成到 NVIDIA 生态系统中,支持 NVIDIA Blackwell 架构。它具有改进的 Base View 的用户界面,使管理员在执行集群操作时拥有更大的灵活性。除了更简洁、更易用的设计,Base View 现在还提供全新的安装向导、监控仪表板和更强的可扩展性。Base Command Manager 11 还能够更轻松地实现 Slurm 就地更新,引入了全新的 JupyterLab 集成,并扩展了“按需集群”生态系统。
Base Command Manager 提供 Base View 界面,用于执行日常操作。它使管理员能够通过图形用户界面快速查看集群的使用情况和运行状况,并执行多项任务。
课程
Base Command Manager 为异构和混合集群提供全面的端到端管理,能够快速、轻松地将数据中心基础设施的利用率最大化。
我们的交互式自主培训课程专为 IT 专业人员设计,将带您探索 Base Command Manager 中的架构、概念和管理工具,并展示如何通过该平台安装和管理集群。
许可证选项
使用经过验证的基础设施管理软件自动构建和管理集群。 NVIDIA Base Command Manager 已在包括 NVIDIA DGX 系统在内的数千个生产环境中部署,是部署和管理 AI 和 HPC 集群的理想选择。
资源