
机器人一定要像人一样有一双灵活的手吗?
如果只是搬运箱子、夹取零件,夹爪看起来已经够用。很多工业机器人也正是靠这种简单、稳定、重复的末端执行器完成工作。
但在矩阵超智创始人兼CEO张海星(Allen Zhang)看来,机器人一旦要进入人的工作和生活空间,就绕不开一双更接近人手的灵巧手。原因并不复杂:现实世界里的很多工具,从剪刀到开关面板,都是按照人的手指来设计的。
在BEYOND Expo 2026物理AI峰会“灵魂与钢铁的融合:基础模型与人形硬件的互通构建”圆桌中,张海星没有把灵巧手单独当成一个硬件问题。对矩阵超智来说,手只是机器人进入现实世界的一部分,背后还需要具身基座大脑、通用运动控制小脑和数据基础设施一起工作。
也就是说,一只手能不能抓住东西,并不只看手指数量。机器人要知道物体在哪里、该从哪个角度接近、用多大力、沿着什么轨迹完成动作。
他分享了抓球体和操作剪刀的例子。三个以上手指可以抓住球体上半部分,再结合滑移力和摩擦力把它拿起来。如果换成夹爪,往往只能夹住球体下半部分。碰到鸡蛋这类脆弱物体时,力用得不对,就容易把物体损坏。
剪刀则把手指协同的重要性展现得更清楚。打开、握住、保持角度、沿着纸张或柔性布料剪切,都需要多个手指一起配合。手指不仅要提供夹持力,还要提供保持力和导向能力。很多人每天顺手完成的动作,换到机器人身上,会变成一串复杂的控制问题。
这些例子也解释了他为什么认为Gripper夹爪更像阶段性方案。随着高自由度灵巧手制造成本下降,机器人会有机会处理更多围绕人手设计的动作。与此同时,力、轨迹、触觉等信息也会进入训练体系,成为操作模型继续迭代的材料。
从手部动作继续往后,问题很快会进入模型架构。机器人不是只要有一只手,就能完成剪切、抓取或触碰,它还要理解物理环境,规划动作,并判断哪些行为可以执行。圆桌讨论到VLA、world model等具身智能架构路线时,张海星回应,具身智能基座模型目前还没有形成共识。矩阵超智推出的Wave模型,试图把物理世界理解、动作执行、行为对齐和端到端决策放进同一个系统。
放回具体任务里,模型要解决的也不只是“看见剪刀”。机器人需要理解剪刀是什么、怎么握、什么时候用力、沿着什么轨迹动作,以及哪些行为可以做、哪些行为不能做。手提供了操作可能,模型则要让这些操作变成可执行的决策。
也正因此,数据会随之变得更细。张海星提到,矩阵超智采用data pyramid数据金字塔,从自然数据到高精度专家数据逐层构建。最高精度的数据,需要人类通过和Matrix 3同构的遥操设备来生成专家数据。
然而,普通互联网数据很难直接教会机器人剪纸、抓球体或处理柔性物体。灵巧手带来的力、trajectory、tactile信息,也需要在真实或接近真实的操作中被记录下来。手越接近人手,机器人要学习的数据就越细。
但这些数据不会凭空产生,往往要跟着真实任务一起积累。哪些应用能先跑出来,也关系到机器人先从哪里获得可用数据、工程经验和客户需求。张海星没有押注某一个单一场景,他认为,具身智能能进入的方向很多,每个细分领域短期都有可能跑出“小独角兽”。
中医理疗、按摩机器人可以做专用本体和专用模型。跳舞、表演、商演、导览等方向,也已经有不少公司做出进展。它们未必代表机器人最终形态,却能在各自场景里先验证一部分能力和商业价值。
他用“盲人摸象”形容当下市场。交互智能可以先形成收入,运动控制也有稳定需求,工厂里的自动化反复装配则更接近当下可验证的效率账。不同路径看到的只是机器人未来的一部分,但早期收入、工程经验和客户需求,会先在这些具体场景里积累起来。
在这些分散路径之外,张海星还给了一个更长期的能力坐标。按照矩阵超智的分级,机器人智能从L1走向L5,当前大致处在L1到L2之间,未来三到五年希望向更高阶推进。到了L5,机器人不只能够执行指令,还可以从失败中学习,持续调整自己的动作。
这也是人形机器人讨论中最容易被忽略的一层。外界常常先看到它有没有一双灵活的手、能不能走得像人、长得像不像人,但真正决定它能不能进入真实环境的,可能是一次次更具体的操作:拿稳一件脆弱物体,完成一次顺畅剪切,在出错之后调整下一次动作。到了那个时候,机器人像不像人或许已经没那么重要,能不能真的帮上忙,才是更直接的问题。
扫码关注我们
2027
澳门
不见不散

