摘要:人工智能为何迟迟无法突破?关键在于缺乏符合物理规律的训练数据。英伟达推出的COSMOS模型,构建了一个接近真实世界的物理仿真平台,为AI提供无限演化空间。
根据英伟达官方文档介绍,NVIDIA Cosmos™ 是一个平台,配备先进的生成式世界基础模型、配备先进的 tokenizer、护栏以及加速数据处理和管理工作流,可满足自动驾驶汽车(AV)以和机器人开发者的需求。
构建物理AI 最大的困难,是在计算机仿真中,无法精确地实现对物理特性的还原,类似于COSMOS这种世界模式,可以解决这一问题。该模型根据过去的观察结果和当前的输入结果预测未来的环境状态。这对于物理 AI 构建者来说非常重要,使他们能够在受控环境中模拟、训练和优化系统。通过这种方式,我们可以用非常廉价的方式搭建几乎真实的仿真场景。
Cosmos 世界基础模型分为三类:Nano,用于针对实时、低延迟推理和边缘部署进行优化的模型;Super,用于高性能基线模型;Ultra,具有高质量和保真度,适合用于蒸馏自定义模型。Cosmos 世界基础模型配合 NVIDIA Omniverse 3D 开发套件,可以实现文本到世界和视频到世界的生成。
NVIDIA Omniverse™ 是一个提供 API、SDK 和服务的平台。借助此平台,开发者可以轻松地将通用场景描述 (OpenUSD) 和 RTX 渲染技术集成到现有软件工具和仿真工作流中,以构建 AI 系统。
将COSMOS中的基础模型,导入UE5的一个基本工作流如下所述:
(1)步骤 1: 在COSMOS 中生成基础模型
(2)步骤 2: 导出模型为USD 格式
(3)步骤 3: 将模型进行预处理
(4)步骤4:调整光照和材质
COSMOS可以生成符合物理世界规则的基础模型和场景,并通过UE内的拆件直接导入到UE中,结合AirSim和rerun等插件,用于对无人机或无人车上搭载的人工智能模块进行训练,或进行仿真验证。无人机或无人车可以在COSMOS中获得和现实世界几乎一致的训练效果,借助COSMOS,AI不仅能“看懂”物理世界,更能“适应”它。关注灵泽,获取cosmos使用指导视频或无人机虚拟实验室的全套方案。

