机器人离ChatGPT时刻还差什么？NVIDIA的答案是这三个- 大数跨境

BEYOND Expo

2026-06-08

在今年的BEYOND Expo 展区中，那些形式各异功能不同的机器人总是人流汇聚的地方。

通道中，负责分发资料的“跑腿机器人”穿过人流。展位旁，能够按照观众选择调配饮品的机器人持续工作。互动区里，也有陪伴型机器人尝试识别游客、回应游客，并用动作完成更自然的交流。它们并不都指向同一种形态，却共同说明一件事：机器人，正在进一步进入物理世界，并成为生活中的一部分。

与展区体验同步发生的，是机器人产业的持续扩张。IFR发布的《World Robotics 2025》报告显示，2024年全球工业机器人新增安装量54.2万台，连续第四年超过50万台。IFR预计，2025年全球安装量仍将保持增长，并在2028年突破70万台。Goldman Sachs Research也预计，2030年全球人形机器人出货量有望超过25万台。

热度正在积累，但机器人距离自己的“ChatGPT时刻”仍有一段更硬的工程路要走。5月27日，NVIDIA机器人与边缘AI副总裁Deepu Talla在BEYOND Expo 2026开幕式上围绕 “ NVIDIA三台计算机” 赋能物理 AI 发表主题演讲。他提到，制造业自动化已经存在50多年，但把AI带进机器人，让自动化进一步走向自主自动化，至今仍是高难度任务。

这种难度，直接体现在物理世界对准确率的要求上。

数字AI在邮件、摘要、代码等任务中出现偏差，很多时候仍有人可以接上最后一步。机器人进入工厂、仓库、道路、医院和服务空间后，面对的是货架、地面、玻璃门、行人、设备、光线和突发状况。一次判断错误，可能直接带来安全、成本和运营风险。

Deepu Talla因此强调，Physical AI的准确率要求更接近“绝对值”，它决定机器人能否从演示走向规模化部署。

在他的分享中，解决机器人挑战需要“三台计算机”：第一台用于训练机器人“大脑”，第二台用于在仿真环境中进行测试和评估，第三台则部署在真实机器人中完成实时执行。换句话说，机器人要进入更广泛的现实世界，关键不只在某一台机器本身，而在数据、仿真和机器人“大脑”三项能力能否同时成熟。围绕这一体系，NVIDIA通过计算平台、参考模型和加速库，来支持开发者训练机器人、构建仿真环境和部署机器人智能，全方位推动物理 AI 走进现实世界。

第一道关口是数据。大语言模型的快速发展，受益于互联网上已经存在的文本、图片、视频和代码。机器人没有同等规模、同等可获得性的动作教材。它要学习移动、抓取、避障、装配、清洁、配送和服务，需要动作数据、传感器数据、环境反馈，也需要足够多的失败经验。真实工厂、医院、仓库和公共道路不可能被拿来无限试错，机器人数据的获得、生成和校验，正在成为Physical AI发展的基础工程。

仿真因此成为第二项能力。Deepu Talla提到，测试机器人的更好方式首先发生在仿真中，因为它更快、更安全，成本也更可控。机器人在进入真实环境前，需要先经历足够多的虚拟变化，包括地面材质、光照条件、遮挡、人类动作、物体摆放和设备干扰。NVIDIA推进的Isaac Lab、Cosmos、 Isaac GR00T等工具，正服务于训练策略、生成合成数据、测试行为表现，再把能力迁移到真实机器人这一链条。它们指向单一机器人产品之外的更大命题：机器人产业从训练到部署的基础设施建设。