人形机器人的发展,这一次跨越了一大步。前两天,美国机器人公司Figure发布了一个可以应用于人形机器人控制的视觉-语言-动作模型:Helix。
在演示当中,这款使用最新模型的Figure机器人,能听懂人类的指令,具备判断能力将食物进行分类,同时两台机器人还可以协作,将食物摆放进冰箱以及橱柜。这意味着,机器人在家用场景下的应用落地,又前进了一大步。
我认为Figure以及Helix最重要的意义是两点:
1、人形机器人在语言和视觉层面正在快速突破,1937年,西屋电气发明的机器人,就已经能够说700个单词了,双眼也能区分红色绿色。但在那之后的几十年里,人形机器人的发展都非常缓慢。这一次因为有了大模型和人工智能的助力,机器人算是真正可以和人类交互,为人类工作了。
2、真正的智能化,一定是人形机器人之间可以协同工作。因为个体的力量是有限的,对于人类如此,机器人也一样,一旦可以协同工作,效率成倍上升,人形机器人也就从单个的智能体,向群体化生产力演变。

