大数跨境
0
0

机器人香港开启极限挑战,丢掉遥控器,硬刚全自主!

机器人香港开启极限挑战,丢掉遥控器,硬刚全自主! 智东西
2025-12-09
9
导读:无遥操、全自主的机器人距离走进人类生活到底还有多远?

无遥操、全自主的机器人距离走进人类生活到底还有多远?

作者 | 许丽思
编辑 | 漠影

机器人后空翻、拳击、拟人奔跑、跳舞等高难度动作已屡见不鲜;进工厂从事分拣、组装、巡检也日趋普遍。公众常因此产生一种观感:机器人已足够聪明能干,离日常生活仅一步之遥。

但回归产业一线,现实画风迥异:行业整体仍处于试点多、规模化少的早期阶段。多数项目停留在实验室Demo和展会秀场,技术路径与商业模式尚在探索中,真正可复制落地的应用极为稀缺。

这种“观感领先、应用滞后”的强烈反差,自然引出核心问题:无遥操、全自主的机器人,距离走进人类生活到底还有多远?

ATEC2025赛事专家委员会主席、香港工程院院士刘云辉教授指出,机器人需具备三大核心能力——行走、操作、改造环境,这是判断其能否适应真实世界的关键依据。从“感知-决策-执行”完整链条看,机器人须实现准确环境感知、全自主决策,并完成长链条任务执行。

当前,这些能力的真实水平如何?行业亟需一个贴近真实、开放可观测的技术验证窗口。

近日,第五届ATEC科技精英赛构建了面向真实世界适应力的测试框架。赛事由香港中文大学主办,ATEC前沿科技探索社区、北京大学、北京师范大学、蚂蚁集团联合承办,评审专家包括刘云辉、谢立华、Masayoshi Tomizuka等国际知名机器人学者。

比赛全程在全户外场景下进行,重点考察机器人的行走、操作与环境改造能力。全球13支顶尖赛队完成了吊桥穿越、定向越野、自主浇花及垃圾分拣等系列任务。

蚂蚁集团技术战略部负责人表示:“每道赛题的设计,都不是为‘完成得好看’,而是为了在真实碰撞中暴露技术弱点。只有真问题,才能牵引真实进步;只有直面短板,行业才知下一步突破方向。”

01 拒绝标准化环境:机器人须进入非结构化的真实场景

当前多数机器人技术验证依赖灯光可控、地面平整、障碍规则的标准化环境。这种设定屏蔽了真实世界的不确定性,即便表现优异,也难以迁移至其他场景。

这构成了判断全自主机器人能否进入人类生活场景的第一道门槛——环境感知能力

真实环境的感知难点在于:需适应复杂光影、杂乱背景与动态杂物;需融合多模态信息;更需在目标与环境持续变化下保持稳定输出。

香港中文大学(深圳)理工学院助理教授钟仿洵指出:“真实环境的最大特征是不确定性和高动态性——你看到的不一定是真的。”机器人必须具备识别并处理感知信息中“不确定性”的能力,这是高级自主的前提。

垃圾分拣即典型例证:垃圾类型、材质、形状各异,还常伴随污渍、遮挡与随意堆叠。同一物体仅因堆叠顺序或污渍微变,实验室训练出的识别模型就可能瞬间失效。

多支赛队反映:实验室精准识别,在真实场景中极易失效。例如,比赛当日强日光导致香蕉皮形变不可逆;实验室采集的桌面点云数据完全不适用,现场反光严重干扰激光相机;透明矿泉水瓶因折射与反光造成多台机器人识别失败;部分机器人甚至未抓取垃圾即盲目前往垃圾桶……

这类现象与工业试点中“换工位、换灯光,效果大打折扣”的情况高度一致,指向同一行业共识:机器人在真实环境下的感知能力,是实现大规模部署的基本前提。

运动场景亦面临类似挑战。定向越野任务中,林间小路光影摇曳、坑洼交错,机器人须实时判断暗块是可通行土路还是需规避的凹陷,依赖感知系统对地形的可靠估计与可通行区域识别。

刘云辉教授强调,该任务旨在自然场景下测试运动与环境识别能力——在有限引导下,观察机器人能否通过实时响应克服障碍、爬山涉水。

冠军团队浙大Wongtsai在Isaac LAB中高度还原比赛场景,甚至专门模拟RealSense相机的双目视差、散斑投射与纹理缺失等噪声。凭借“仿真到真实”的闭环设计,其四足机器人成为首个全自主跑完全程定向越野的参赛选手。

行业正加速从“标准场地可用”迈向“真实场景可用”。真实环境,是机器人走出Demo、实现多场景复制落地的必修课。

若机器人能全自主完成垃圾分拣,攻克复杂视觉感知、多材质识别与稳定抓取等长期难题,便有望应用于工厂、环卫、物流等“脏乱差”场景;若可自主完成定向越野,则为园区巡检、户外勘探、灾害救援等复杂地形任务提供关键支撑。

02 摆脱人类遥控:机器人大规模落地需要自主决策

当前大量炫酷机器人演示实为人类遥控操作,机器人本质是远程操作平台,而非具备独立决策能力的智能体。该模式在产业早期确有助快速验证能力、积累数据与经验。

但机器人表现往往依赖人类经验判断与临场干预,实质是“人脑代劳”,易掩盖其在感知、决策等环节的真实短板,无法反映无人干预下的真实能力——这构成了第二道关键门槛:决策自主性

行业头部企业已明确转向。以特斯拉Optimus为例,年中起放弃传统遥控学习路径;马斯克10月评论其功夫视频时直言:“是AI,不是遥控”。无遥操已成为具身智能企业发展的清晰共识。

全自主、无遥操是行业发展的重要趋势。赛事评分规则亦明确奖励无遥操表现。但技术跃迁极具挑战。浙大Wongtsai团队队长朱承睿比喻:“从人类遥控到自主控制,堪比蒸汽机时代迈向电气化时代的飞跃。”

吊桥穿越任务中,机器人需识别三种不同间距桥面段,自主判断是否借助工具、是否拉绳搭桥。有队伍加装宽幅“脚底板”防卡缝;有机器狗选择跳跃绕开,跳过拉绳步骤。

刘云辉院士指出,该任务核心在于“决策与规划”:因桥板位置各异,机器人须自主评估环境、使用工具、调整策略以改变环境、适配自身运动,属于融合环境评估、工具使用与任务规划的高级智能行为。

港中文CUMAE团队指出,不同任务对硬件与AI能力要求各异,二者须在大系统中协同演进,而非各自孤立发展——这一思路为未来技术攻关提供了新路径。

目前,机器人“小脑”(运动控制与性能)进步飞快,但“大脑”(AI能力)仍处初级阶段。业界普遍认为:AI能力不足,是制约机器人规模化落地的核心瓶颈之一。

随着行业迈向规模化落地,全自主能力正成为企业核心竞争壁垒,更是机器人从“工具”升级为“伙伴”的标志性能力。

03 不止单一能力:机器人需要稳定跑完一整条长程任务链

即使感知与决策能力均达标,机器人能否进入人类生活场景,还取决于第三维度:能否稳定执行具有多步骤、多动作的长程任务链,而非仅完成单点精彩动作。

多数遥控演示聚焦单一动作极限,但真实场景如仓储拣选、园区巡检、灾害救援等,均依赖复杂动作串联的全流程任务。家庭场景亦然:叠衣、浇花、洗碗、收纳等皆属长程任务。

以浇花为例:需完成取水壶→接水→移至花盆→精准浇水→归位全流程。过程中水壶重量与重心持续变化,考验的是感知、规划、力控与步态协同的一体化能力。

ATEC自主浇花任务直观呈现该系统性挑战:部分机器人拿起水壶后频繁晃动、定位不准,需多次人工干预;少数队伍虽能走通全流程,但速度缓慢——这与现实中“机器人总需人工救场”的情形高度吻合。

浙大Wongtsai团队指出:“VLA模型虽有一定泛化能力,但仅能理解图像与语言指令,无法对应真实物理交互,在物理世界理解和操作层面存在明显不足。”最终团队采用传统视觉识别+机械臂规划方案。

北理工CyberPrime团队分析,自主浇花难以全自主完成主因有二:硬件上,高精度机械臂搭载于四足平台后稳定性差、速度慢;软件上,操作算法泛化能力弱,实验室少量样本训练策略无法适配现场环境。他们认为,当前瓶颈并非运动能力,而在操作精度、安全性和自主性——这正是实验室未来几年重点攻坚方向。

这也揭示了具身智能当前处境:各类模型与算法看似聪明,一旦落实到机器人执行层便处处受限,软硬件脱节;机器人“下半身”能顺利移动,“上半身”操作却异常吃力。更严格地说,即便能跑起来,在长时间、多轮次、跨场景的任务链下,其稳定性与可维护性仍难保障。

未来真正落地的机器人产品,必须跨越长程任务链这道坎,重视系统可靠性与任务完整性,实现移动与操作的统一。

04 结语:真实世界“翻车”很正常,是具身智能落地的必经之路

两天比赛中,任务挑战巨大,全自主难度极高,机器人“翻车”频发。

但刘云辉院士认为:“翻车很正常,本身就是进步——至少机器人被放到了真实场景中接受检验。失败也是结果,能反馈问题、启发反思、推动改进。没有失败,就永远不会有成功。”

面对户外复杂场景,各参赛队伍尝试多样化技术路径:有团队并行测试模块化算法与端到端大模型,寻求稳定性与智能化平衡;有队伍为应对吊桥动态晃动,创新融合轻量化控制与实时环境建模。这些探索为机器人场景落地积累了宝贵实践经验。

多位选手表示,ATEC赛题设置贴近现实,对技术发展更具实际意义。他们怀抱强烈使命感,期待机器人承担人类难以胜任或危险的工作——真实世界的极限挑战,正是通往这一愿景的起点。

具身智能要从风口故事变为基础设施,亟需一套经得起时间检验的测试场与评价体系。几年后回望,这场不追求“爽感”、扎根真实场景的大赛,或许正是该体系的早期雏形。

【声明】内容源于网络
0
0
智东西
各类跨境出海行业相关资讯
内容 10843
粉丝 0
智东西 各类跨境出海行业相关资讯
总阅读55.5k
粉丝0
内容10.8k