集群管理标准。
概览
NVIDIA Base Command Manager 标准适用于大规模调配、管理和监测高性能计算 (HPC) 和 AI 集群,拥有超过十年的久经考验的性能。它可管理并自动执行端到端的操作,以处理与硬件无关的混合环境,从几个节点到数十万个节点,涵盖边缘设备、数据中心、多云或混合云部署。 凭借可靠的核心功能、可预测的发布特性、对 NVIDIA Blackwell 和 NVIDIA Rubin 架构的支持,以及多种用户界面选项,Base Command Manager 成为团队更大限度提高基础设施利用率的基础,工作负载得以一致、高吞吐量运行。
Base Command Manager 提供快速部署和端到端管理。
最新发布
NVIDIA Base Command Manager 11 已全面集成在 NVIDIA 生态系统中,支持 NVIDIA 的最新架构。 它具有改进的 Base View 的用户界面,使管理员在执行集群操作时拥有更大的灵活性。除了更简洁、更易用的设计,Base View 现在还提供全新的安装向导、监测仪表板和更强的可扩展性。Base Command Manager 11 还能够更轻松地实现 Slurm 就地更新,引入了全新的 JupyterLab 集成,并扩展了“按需集群”生态系统。
Base Command Manager 提供 Base View 界面,用于执行日常操作。它使管理员能够通过图形用户界面快速查看集群的使用情况和运行状况,并执行多项任务。
在单一管理平台下,全面支持 NVIDIA GPU 加速和其他加速系统,以及 Arm® 和基于 x86 的 CPU 节点,从单个节点到数千个节点,简化集群调配和自动化。
通过预构建、可定制的仪表板和实时健康监控优化集群资源,让管理员能够清晰地了解趋势,从而提高集群利用率并加速数据中心的投资回报率。
Base Command Manager 包含 BaseView,这是一个用于日常集群操作的直观 Web 界面,可通过完整的命令行和 API 选项访问相同功能,以实现自动化和集成。
Base Command Manager 拥有数千次部署案例 (包括在 NVIDIA DGX™ 系统上),是适用于 HPC 和 AI 集群的可靠且经过验证的解决方案,可提供发布的可预测性,使功能能够不断更新、测试和微调。
课程
Base Command Manager 为异构和混合集群提供全面的端到端管理,能够快速、轻松地将数据中心基础设施的利用率最大化。
我们的交互式自主培训课程专为 IT 专业人员设计,将带您探索 Base Command Manager 中的架构、概念和管理工具,并展示如何通过该平台安装和管理集群。
许可证选项
使用经过验证的基础设施管理软件自动构建和管理集群。 NVIDIA Base Command Manager 已在包括 NVIDIA DGX 系统在内的数千个生产环境中部署,是部署和管理 AI 和 HPC 集群的理想选择。
资源