世界基础模型
领先的世界生成模型,可灵活适配各类物理 AI 任务或环境。
使用 2B/14B 模型,根据文本、图像或视频生成 30 秒预测视频世界,或对数据进行后训练,以创建自定义边缘案例、闭环策略和多视图、以机器人为中心的仿真环境。
用于仿真到照片级逼真转换的多控制模型。
与 CARLA 或 NVIDIA Isaac Sim™ 等物理 AI 仿真框架搭配使用,可在各种环境和光照条件下加速合成数据生成。
领先的视觉语言模型 (VLM),使机器人和视觉 AI 智能体具备类似人类的推理能力。
结合先前知识、物理规律和常识,为公共安全、流量监控、物流、质量检测和物理 AI 提供实时警报和可操作的洞察。
加速高效的数据集处理和评估。
应用案例
针对下游任务、环境、摄像头或传感器布局及策略构建自定义世界模型。
生成自定义、多样化、高保真的传感器数据,用于安全地训练、测试和验证自动驾驶汽车。
提高工业和城市环境的自动化水平、安全性及运营效率。
借助 Cosmos Reason,AI 智能体可对实时或录制的视频流进行分析、总结与交互,从而:
开始选项
AI 基础设施
NVIDIA RTX PRO 6000 Blackwell 系列服务器可加速机器人、智能汽车和 AI 智能体的物理 AI 开发,涵盖训练、合成数据生成、仿真和推理。
在 NVIDIA Blackwell GB200 上释放 Cosmos 世界基础模型的峰值性能,用于工业后训练和推理工作负载。
生态系统
自机器人开发、智能汽车和视觉 AI 行业的模型开发者正在使用 Cosmos 加速物理 AI 开发。
[2026 年 1 月 22 日] 发布了关于 Cosmos 策略的研究,该研究基于 Cosmos Predict-2 进行视觉运动控制规划。
[2026 年 2 月 9 日] 全新 Cosmos Reason 2 增强计算支持、量化和 CUDA 兼容性。
[2025 年 12 月 19 日] 通过 Hugging Face 发布 Cosmos-Predict2.5-2B Diffusers 支持,在 Hugging Face 上发布 Cosmos-Predict2.5-2B Text2World 蒸馏权重以及蒸馏指南。
[2025 年 12 月 19 日] 发布了 Cosmos Transfer 2.5 的 Image2Image 和 ImagePrompt 功能。 请在此处查看推理指南。
探索 GitHub 了解详情。
Cosmos 世界基础模型采用 NVIDIA 开放模型许可证,向所有人开放使用。
请参阅全新的 Cosmos 开发手册,其中包含分步方案和后训练脚本,可帮助您快速构建、定制和部署面向机器人开发和辅助驾驶系统的 NVIDIA Cosmos 世界基础模型。
可以,您可以利用 Cosmos 使用您首选的基础模型或模型架构从头开始构建。 您可以开始使用 Cosmos Curator 进行视频数据预处理。 然后使用 Cosmos tokenizer 对数据进行压缩和解码。 数据处理后,您可以训练或调优模型。
可使用 NVIDIA NIM™ 微服务,轻松将物理 AI 模型集成到云端、数据中心和工作站的应用中。
您还可以使用 NVIDIA DGX Cloud 训练 AI 模型,并将其大规模部署到任何地方。
这三款都是世界基础模型,发挥不同作用:
Omniverse 使用不同的生成式 API、SDK 和 NVIDIA RTX 渲染技术,创建了现实世界任务的逼真 3D 仿真。
开发者可将 Omniverse 仿真作为指令视频输入到 Cosmos Transfer 模型,以生成可控制的照片级逼真的合成数据。
Omniverse 共同提供训练前后仿真环境,而 Cosmos 提供基础模型来生成视频数据并训练物理 AI 模型。
详细了解 NVIDIA Omniverse。