矩阵超智张海星：机器人要进入人的世界，要先学会用人的工具- 大数跨境

首页

矩阵超智张海星：机器人要进入人的世界，要先学会用人的工具

BEYOND Expo

2026-06-09

机器人一定要像人一样有一双灵活的手吗？

如果只是搬运箱子、夹取零件，夹爪看起来已经够用。很多工业机器人也正是靠这种简单、稳定、重复的末端执行器完成工作。

但在矩阵超智创始人兼CEO张海星（Allen Zhang）看来，机器人一旦要进入人的工作和生活空间，就绕不开一双更接近人手的灵巧手。原因并不复杂：现实世界里的很多工具，从剪刀到开关面板，都是按照人的手指来设计的。

在BEYOND Expo 2026物理AI峰会“灵魂与钢铁的融合：基础模型与人形硬件的互通构建”圆桌中，张海星没有把灵巧手单独当成一个硬件问题。对矩阵超智来说，手只是机器人进入现实世界的一部分，背后还需要具身基座大脑、通用运动控制小脑和数据基础设施一起工作。

也就是说，一只手能不能抓住东西，并不只看手指数量。机器人要知道物体在哪里、该从哪个角度接近、用多大力、沿着什么轨迹完成动作。

他分享了抓球体和操作剪刀的例子。三个以上手指可以抓住球体上半部分，再结合滑移力和摩擦力把它拿起来。如果换成夹爪，往往只能夹住球体下半部分。碰到鸡蛋这类脆弱物体时，力用得不对，就容易把物体损坏。

剪刀则把手指协同的重要性展现得更清楚。打开、握住、保持角度、沿着纸张或柔性布料剪切，都需要多个手指一起配合。手指不仅要提供夹持力，还要提供保持力和导向能力。很多人每天顺手完成的动作，换到机器人身上，会变成一串复杂的控制问题。

这些例子也解释了他为什么认为Gripper夹爪更像阶段性方案。随着高自由度灵巧手制造成本下降，机器人会有机会处理更多围绕人手设计的动作。与此同时，力、轨迹、触觉等信息也会进入训练体系，成为操作模型继续迭代的材料。

从手部动作继续往后，问题很快会进入模型架构。机器人不是只要有一只手，就能完成剪切、抓取或触碰，它还要理解物理环境，规划动作，并判断哪些行为可以执行。圆桌讨论到VLA、world model等具身智能架构路线时，张海星回应，具身智能基座模型目前还没有形成共识。矩阵超智推出的Wave模型，试图把物理世界理解、动作执行、行为对齐和端到端决策放进同一个系统。

放回具体任务里，模型要解决的也不只是“看见剪刀”。机器人需要理解剪刀是什么、怎么握、什么时候用力、沿着什么轨迹动作，以及哪些行为可以做、哪些行为不能做。手提供了操作可能，模型则要让这些操作变成可执行的决策。

也正因此，数据会随之变得更细。张海星提到，矩阵超智采用data pyramid数据金字塔，从自然数据到高精度专家数据逐层构建。最高精度的数据，需要人类通过和Matrix 3同构的遥操设备来生成专家数据。

然而，普通互联网数据很难直接教会机器人剪纸、抓球体或处理柔性物体。灵巧手带来的力、trajectory、tactile信息，也需要在真实或接近真实的操作中被记录下来。手越接近人手，机器人要学习的数据就越细。

但这些数据不会凭空产生，往往要跟着真实任务一起积累。哪些应用能先跑出来，也关系到机器人先从哪里获得可用数据、工程经验和客户需求。张海星没有押注某一个单一场景，他认为，具身智能能进入的方向很多，每个细分领域短期都有可能跑出“小独角兽”。

中医理疗、按摩机器人可以做专用本体和专用模型。跳舞、表演、商演、导览等方向，也已经有不少公司做出进展。它们未必代表机器人最终形态，却能在各自场景里先验证一部分能力和商业价值。

他用“盲人摸象”形容当下市场。交互智能可以先形成收入，运动控制也有稳定需求，工厂里的自动化反复装配则更接近当下可验证的效率账。不同路径看到的只是机器人未来的一部分，但早期收入、工程经验和客户需求，会先在这些具体场景里积累起来。

在这些分散路径之外，张海星还给了一个更长期的能力坐标。按照矩阵超智的分级，机器人智能从L1走向L5，当前大致处在L1到L2之间，未来三到五年希望向更高阶推进。到了L5，机器人不只能够执行指令，还可以从失败中学习，持续调整自己的动作。

这也是人形机器人讨论中最容易被忽略的一层。外界常常先看到它有没有一双灵活的手、能不能走得像人、长得像不像人，但真正决定它能不能进入真实环境的，可能是一次次更具体的操作：拿稳一件脆弱物体，完成一次顺畅剪切，在出错之后调整下一次动作。到了那个时候，机器人像不像人或许已经没那么重要，能不能真的帮上忙，才是更直接的问题。

END