在今年的BEYOND Expo 展区中,那些形式各异功能不同的机器人总是人流汇聚的地方。
通道中,负责分发资料的“跑腿机器人”穿过人流。展位旁,能够按照观众选择调配饮品的机器人持续工作。互动区里,也有陪伴型机器人尝试识别游客、回应游客,并用动作完成更自然的交流。它们并不都指向同一种形态,却共同说明一件事:机器人,正在进一步进入物理世界,并成为生活中的一部分。
与展区体验同步发生的,是机器人产业的持续扩张。IFR发布的《World Robotics 2025》报告显示,2024年全球工业机器人新增安装量54.2万台,连续第四年超过50万台。IFR预计,2025年全球安装量仍将保持增长,并在2028年突破70万台。Goldman Sachs Research也预计,2030年全球人形机器人出货量有望超过25万台。
热度正在积累,但机器人距离自己的“ChatGPT时刻”仍有一段更硬的工程路要走。5月27日,NVIDIA机器人与边缘AI副总裁Deepu Talla在BEYOND Expo 2026开幕式上围绕 “ NVIDIA三台计算机” 赋能物理 AI 发表主题演讲。他提到,制造业自动化已经存在50多年,但把AI带进机器人,让自动化进一步走向自主自动化,至今仍是高难度任务。
这种难度,直接体现在物理世界对准确率的要求上。
数字AI在邮件、摘要、代码等任务中出现偏差,很多时候仍有人可以接上最后一步。机器人进入工厂、仓库、道路、医院和服务空间后,面对的是货架、地面、玻璃门、行人、设备、光线和突发状况。一次判断错误,可能直接带来安全、成本和运营风险。
Deepu Talla因此强调,Physical AI的准确率要求更接近“绝对值”,它决定机器人能否从演示走向规模化部署。
在他的分享中,解决机器人挑战需要“三台计算机”:第一台用于训练机器人“大脑”,第二台用于在仿真环境中进行测试和评估,第三台则部署在真实机器人中完成实时执行。换句话说,机器人要进入更广泛的现实世界,关键不只在某一台机器本身,而在数据、仿真和机器人“大脑”三项能力能否同时成熟。围绕这一体系,NVIDIA通过计算平台、参考模型和加速库,来支持开发者训练机器人、构建仿真环境和部署机器人智能,全方位推动物理 AI 走进现实世界。
第一道关口是数据。大语言模型的快速发展,受益于互联网上已经存在的文本、图片、视频和代码。机器人没有同等规模、同等可获得性的动作教材。它要学习移动、抓取、避障、装配、清洁、配送和服务,需要动作数据、传感器数据、环境反馈,也需要足够多的失败经验。真实工厂、医院、仓库和公共道路不可能被拿来无限试错,机器人数据的获得、生成和校验,正在成为Physical AI发展的基础工程。
仿真因此成为第二项能力。Deepu Talla提到,测试机器人的更好方式首先发生在仿真中,因为它更快、更安全,成本也更可控。机器人在进入真实环境前,需要先经历足够多的虚拟变化,包括地面材质、光照条件、遮挡、人类动作、物体摆放和设备干扰。NVIDIA推进的Isaac Lab、Cosmos、 Isaac GR00T等工具,正服务于训练策略、生成合成数据、测试行为表现,再把能力迁移到真实机器人这一链条。它们指向单一机器人产品之外的更大命题:机器人产业从训练到部署的基础设施建设。
第三项能力是机器人“大脑”。Deepu Talla提到,许多团队正在尝试构建通用机器人“大脑”。它面对的问题不同于ChatGPT。语言模型主要处理知识和表达,机器人还要把视觉、空间理解、任务规划和动作控制结合起来。
更复杂的是,机器人没有统一身体。自动驾驶汽车、仓储机器人、工业机械臂、人形机器人、手术机器人和农业机器人,形态、传感器、自由度与任务边界都不同。通用“大脑”需要适配不同本体,也要处理导航、抓取、操作、避障和人机协作。
因此,机器人产业的跃迁不会由单一模型完成。模型能力之外,传感器、执行器、边缘计算、机械结构、安全体系和成本控制都必须同步推进——而这也正是机器人是否迎来自己的“ChatGPT时刻”的最好答案。
扫码关注我们
2027
澳门
不见不散

