用于物理 AI 的合成数据生成

加速物理 AI 工作流开发。

工作负载

仿真/建模/设计
机器人
生成式 AI

行业

全部行业

业务目标

创新

产品

NVIDIA Omniverse Enterprise
NVIDIA AI
NVIDIA Isaac

概览

为什么使用合成数据?

在开发物理 AI 模型时,都需要用到经过仔细标记、高质量的多样化数据集,才能达到所需的模型精度和性能。 在许多情况下,数据会受到限制或无法使用。 在现实世界中,收集和标记这些数据不仅耗时,而且成本高昂。这可能会减缓物理 AI 模型的开发。

合成数据通过计算机仿真、生成式 AI 模型或两者的结合生成,有助于应对这一挑战。合成数据可由文本、视频以及跨视觉和非视觉频谱的 2D 或 3D 图像组成,可与实际数据一起用于训练多模态物理 AI 模型。 利用合成数据生成 (SDG) 技术可以大幅节省训练时间和训练成本。

AI 模型训练速度

弥补数据差异加速 AI 模型开发,同时降低获取和标记文本、视觉和物理 AI 模型所需数据的总体成本。

隐私和安全

通过生成内容多样的合成数据集来模拟现实世界,解决隐私问题并减少偏差。

准确

通过在训练时使用包含罕见但重要的极端案例的数据(通常不可能收集到),创建高度准确的通用 AI 模型。

可扩展

使用自动化工作流数据以程序化方式生成数据,这些数据可根据您在制造业、汽车业、机器人业等领域的用例进行扩展。

用于物理 AI 开发的合成数据

物理 AI 模型支持自主系统感知、理解环境,与物理世界进行交互、导航。合成数据对于训练和测试物理 AI 模型至关重要。

世界模型训练

世界模型 利用各种输入数据,包括文本、图像、视频和运动信息,以极高的模型精度生成并仿真虚拟世界。

世界模型的特点是具有卓越的泛化能力,对于各种应用,只需进行极少的微调。 其可作为机器人和智能汽车的认知引擎,充分发挥对现实世界动态的全面理解。 为了达到这种复杂程度,世界模型要依赖于海量训练数据。 

世界模型的开发受益于通过物理精准仿真生成的大量合成数据。这种方法不仅可加速模型训练过程,还可提高模型在不同场景中的泛化能力。 域随机化技术通过允许对光照、背景、颜色、位置和环境等多个参数进行操作,进一步增强了这一过程,这些变化仅通过真实世界的数据几乎无法全面捕获。

机器人策略训练

机器人学习 是一系列算法和方法的集合,帮助机器人在模拟环境或现实世界中学习新技能,如操作、移动和分类。强化学习、模仿学习和扩散策略是用于训练机器人的关键方法。  

机器人的一项重要技能是操作,比如拿起物品、对它们进行分类并组装,就像您在工厂中看到的那样。 通常,现实世界的人类示范会被用作训练的输入数据。 然而,收集大量且多样化的数据成本相当高昂。 只需少量真实数据,开发者就能在仿真环境中生成合成动作,加快机器人训练过程。

为实现这一目标,开发者可以利用基于 NVIDIA Cosmos™ 构建的 NVIDIA Isaac GR00T-Mimic 和 GR00T-Dreams blueprint,生成用于训练的大型、多样化合成运动数据集。

NVIDIA Isaac GR00T-Dreams blueprint 根据单个图像和语言指令,使用 Cosmos 生成大量合成轨迹数据。这使机器人能够在不熟悉的环境中学习新任务,而无需特定的远程操作数据。

NVIDIA Isaac GR00T-Mimic blueprint 仅通过少量人类演示即可生成大量合成轨迹数据。这使机器人能够在已知任务和环境中改进操作。

然后,这些数据集可用于在 Isaac Lab 中训练 Isaac GR00T 开放基础模型,从而实现通用人形机器人推理和稳健的技能获取。

测试和验证

软件在环 (SIL) 对于 AI 赋能机器人和自动驾驶汽车而言是一个关键的测试阶段。在这个阶段,控制软件将在仿真环境中进行测试,而不是在真实硬件上进行测试。

仿真生成的合成数据可确保对真实物理现象进行精确建模,包括传感器输入、执行器动态和环境相互作用。 这也提供了一种截取罕见场景的方法,而在现实世界中捕捉这种场景是很危险的。这可确保在仿真环境中机器人软件栈的表现与在实体机器人上表现一致,从而无需物理硬件,即可进行全面测试和验证。  

这些仿真机器人可以通过环境中的感知和推理来执行任务。 这种机器人能够规划后续运动,然后执行在数字孪生环境中仿真的行动。 来自这些仿真的合成数据会反馈给机器人大脑。 机器人大脑感知结果决定下一个行动,Mega 精确跟踪数字孪生中的所有资产的状态和位置,如此循环往复。

如何构建生成式 AI 赋能的 SDG 工作流

生成式 AI 可大幅加速大规模生成物理精准合成数据的过程。 开发者可以通过分步参考工作流,将生成式 AI 用于 SDG。


技术运用

用于物理 AI 的合成数据生成

  • 场景创建:将全面的 3D 场景作为基础,其中包含各种重要资产,如用于仓库的货架、箱子和托盘,或用于室外环境的树木、道路和建筑物。 可使用 NVIDIA 通用场景描述 (OpenUSD) NIM™ 微服务 对环境进行动态增强,从而实现对不同对象的无缝添加,并融入 360° HDRI 背景。
  • 域随机化:开发者可以利用 USD Code NIM(专门用于 OpenUSD 的前沿 LLM)执行域随机化操作。 这一强大的工具不仅能解答与 OpenUSD 相关的疑问,还能生成 USD Python 代码以对场景进行修改,从而简化 NVIDIA Omniverse 中各种场景参数的编程更改流程。
  • 数据生成:第三步涉及导出初始标注图像集。 Omniverse 提供多种内置标注器,包括 2D 边界框、语义分割、深度图、表面法线等。 输出格式(如边界框或动画)的选择取决于特定的模型要求或用例。
  • 数据增强:在最后阶段,开发者可以利用 NVIDIA Cosmos 世界基础模型 (WFM) 将图像从 3D 进一步增强为真实图像。 其可通过简单的用户提示为生成的图像带来所需的照片级效果。

开始体验

借助 NVIDIA Isaac Sim,为机器人仿真、工业检测和其他物理 AI 案例构建自己的 SDG 工作流。

相关用例