强化学习

机器人学习技术,用于开发高效的自适应机器人应用。

Nissan

Image Credit: Agility, Apptronik, Fourier, Unitree

工作负载

机器人

行业

全行业

业务目标

创新

产品

NVIDIA AI Enterprise
NVIDIA Isaac GR00T
NVIDIA Isaac Lab
NVIDIA Isaac Sim
NVIDIA Omniverse

利用强化学习让实体机器人掌握复杂技能

随着机器人承担的任务日益复杂,传统编程显得力不从心。强化学习 (RL) 弥补了这一差距,通过让机器人在仿真环境中进行试错训练,从而提升其在控制、路线规划和操作方面的技能。奖励学习通过动态适应机制,使机器人能够发展出高级运动技能,完成现实世界中的如抓取、移动和复杂操作的自动化任务。

GPU 加速的机器人强化学习训练

传统基于 CPU 的机器人强化学习训练在应对复杂任务时通常需调用数千个计算核心,这显著增加了机器人应用的成本。NVIDIA 加速计算凭借并行处理能力,能够有效应对这一挑战,在感知增强型强化学习环境中显著加速了感官数据的处理。这项技术可显著增强机器人在动态情境中学习、适应和执行复杂任务的能力。

NVIDIA 加速计算平台(包括 NVIDIA Isaac™ Lab 等机器人训练框架)利用 GPU 的强大算力支持 RL 工作流中的物理仿真和奖励计算,消除了性能瓶颈,简化了流程,促进了从仿真到部署的顺畅过渡。

强化学习 Isaac Lab

Isaac Lab 是基于 NVIDIA Isaac Sim™ 构建的模块化框架,可用于简化强化学习、模仿学习等机器人训练工作流。开发者可以利用最新 Omniverse™ 功能来训练具备感知能力的复杂策略。

  • 场景搭建:第一步是在 Isaac Sim 或 Isaac Lab 中构建场景,并从 URDF 或 MJCF 导入机器人资产。应用物理架构进行仿真,并集成传感器,进行基于感知的策略训练。
  • 定义 RL 任务:完成场景与机器人配置后,下一步是定义要完成的任务和奖励函数。在基于管理器或直接工作流的环境中,提供智能体的当前状态,同时观察并执行其提供的操作。环境随即通过提供下一个状态,对智能体做出响应。
  • 训练:最后一步是确定训练所需的超参数和策略网络架构。Isaac Lab 提供四个基于 GPU 进行模型训练的强化学习库:StableBaselines3RSL-RLRL-Games SKRL
  • 扩展:开发者可以使用 OSMO 在分布式基础设施上对多节点训练任务进行编排,在多 GPU 和多节点系统中扩展训练。

NVIDIA Isaac GR00T 为开发者提供了一种专用于开发人形机器人的全新方式。这个用于机器人基础模型与数据管道的研究计划和开发平台,能够帮助机器人理解语言、精准模拟人类动作,并通过多模态学习快速掌握各类技能。

如需了解详情并访问 GR00T,申请加入 NVIDIA 人形机器人开发者计划

合作伙伴生态系统

看看我们的生态系统正在如何基于强化学习和 NVIDIA 技术开发自己的机器人应用和服务。

开始体验

当今的研究人员和开发者将强化学习广泛应用于机器人开发。进一步了解用于机器人学习的 NVIDIA Isaac Lab

新闻