大数跨境

我们做出了会跳舞的机器人,然后呢?

我们做出了会跳舞的机器人,然后呢? 知乎AI先行者
2025-12-26
0
导读:在机器人会跳舞的 2025 年,我们还在等它干活

2025 年,对科技行业来说是快速变化、持续加速的一年。年关将至,知乎科技邀请 AI 行业的亲历者们分享自己的「 AI 中场时刻」 —— 不论是高光、迷茫,还是转折。

以期为更多同行者提供行业与人生的样本。

知友@许华哲Harry 与@周博宇 都在具身智能行业中,回顾今年机器人在国内外的发展、行业与个人能做的事情,他们不约而同地提到:

我们期待「有用」。

更多同行者故事,戳这里查看。

@许华哲Harry

加州大学伯克利分校 计算机博士

北京下雪了。

我在搜狐大厦星巴克刚送走朋友,目送他一段。我当然不是爱上了他,而是想看看他的在刚落雪又融化的地面上如何保持平衡。我想结论很简单:不如 G1 机器人,但好在他很聪明。

回想起几年前,我们还在讨论机器人什么时候能全地形走路,后来发现这个话题变成了跑酷、跳舞、篮球。这个变化速率让我知道这个事儿已经成了,如果明年可以攀岩我并不吃惊。

但这极快的变化速率又显得格外不协调,因为我没在任何地方看到人形机器人真正服务人类。快递分拣平均速率是 1800 件每小时,汽车工厂要万分之一甚至十万分之一的失误率。达成的那一天似乎一直在一个不远不近的地方招手 —— 隔三差五有人宣称任务已经解决,但和跳舞的同行不同,我们只能在视频里见到它。

就像前面说的速率上的不协调,回望 2025 的具身智能,我发现了好几个这样不协调的相互映照的「对子」。当然我对它们也有个人的主观臆断,所以也请读者担待冒失的地方。

一、两个世界的机器梦

从 22 年、23 年同步出发,我们和大洋彼岸几乎同步启航了具身智能的事业。但是到了 2025 年,我们看到了一个比较明显的分野,中国的公司花更多的力气搞量产、美国公司则展示 AI 技术上限。

我看到 Generalist 的 Gen0 精细的操作,看到 Sunday 的长程任务能力,看到 pi0.6 的持续工作能力,内心是有焦虑的。我有一个不好的直觉,我们要评估我们的技术是不是落后,但我想这里,我有责任,@李弘扬 @赵行 @王鹤 @高阳 @庞江淼 @穆尧 @周博宇 @陈源培 @... 也都有责任。

量产重不重要,非常重要,但是机器人不是汽车,需要 AI 能力来领跑。

我觉得我们要适应一件事,就是时代变了。

在过往的技术上,我们采用跟随策略;在大模型上我们已经产生了 DeepSeek 这样的原始创新;在具身智能上,我们应该有信心也有概率,最大的那件事儿发生在中国。

我在 https://zhuanlan.zhihu.com/p/683671286 中也有讨论过:「简单说你用修长城的场,不管给多少人、多少机器、多少钱该干不出来还是干不出来,该撵不上就还是撵不上」。

我理解努力做确定性有收益的事情的那种爽感:我努力、我成长、我收获。但是我想我们真正缺乏的还是:我努力、我失败了 99 次、但我吸取教训并且期待第 100 次也许会成功。在一些人「成功地」蒸馏别人的模型时,另一些人在「失败地」研制新的算法。

我认为商业化很重要,也深知量产的严肃性,我只是怕我们错过了最大的那个西瓜。

二、落地简单场景还是挑战困难场景

这阵子也有看过一些场景,各种各样的工厂。我有一个稍有一点悲观的暂时性结论:高价值高重复的场景,总会出现一个深圳或者无锡的聪明人,造出一套自动化设备解决 90% 的问题。这个结论的反面是 —— 目前没有自动化的事情,往往要么单价不高,要么重复度不高。因此,我反而觉得具身智能相比于传统的工业机器人更像是大模型。

让我们沿着这一类比去想,就像大模型不应该花时间在情感理解,文章摘要这样的任务上一样,具身智能就不应该做这些简单地任务,而是应该去挑战强操作、高泛化的事情。这样我们也更能期待一个高质量的模型,通用地解决许多事情。

当然,我们不能否定现有落地的价值,因为很多向具体场景的落地无论未来的智能模型有多强,都还是需要比较高的迁移成本的,这个路早趟过去也是好的。

三、「预训练」配合「先验学习」

具身智能的数据瓶颈天然存在,仿真数据不足、真机数据的缺乏,会逐渐解决但也会持续存在。因此,具身智能恐怕不能先穷尽预训练数据,再走向模型探索,而是需要螺旋上升式地进行探索。因此未来我们可能会看到,一个预训练好的模型,用强化学习在一些任务上变得拥有超越人类的能力;而这个模型可能又会在未来更多的数据上——包括增采的和真机探索的——训练得更好。

同样的逻辑,也适用于世界模型,我从不相信我们能够从人类采集好的数据里面训练出一个足够好的世界模型,相反,我们需要机器人真正地自主与世界交互,才能找到真正属于自己的世界模型。我还一直有一个很感兴趣的话题,用一套强化学习目标函数来完成预训练和后训练,但这是来年的事情了。

所有的成长,都是挣扎着向上。

具身智能的2025年,没有一步登天,但是确实越来越强烈地感受到一种未来在召唤。

突然想起了前阵子和小龙的一次闲聊:

-但也没感觉很遥远了

-确实,不算太远了

-It’s an exciting time. Just needs execution.

是我们对话的结束。

最后想送给所有梦想着让机器人帮助所有人的朋友,一句《马大帅》里的话:

让我们抓紧时间慢慢等吧。


@周指导

机器人 南方科大博导 

robotics-star.com

最近在一些平台做 Ask me anything,收到了不少留言,有问技术细节的,有聊行业趋势的,也有很多透着迷茫的提问。

比如「老师,机器人导航和人形机器人哪个方向更有前途?」「求推荐最好的博士课题?」「 XX 和 YY,哪个方向就业更稳?」能明显感觉到,很多青年学生都想在科研起步前,找到一个最优解。

确实,现在 AI 对行业的冲击真不小,比起很多传统领域,声势确实猛。

一方面,总听到有人说 control is dead,还在纠结SLAM 还有没有用—— 2024 年的 ARTS 会议上,大家还专门围绕这个话题辩论过;更有人直言早知道学纯 AI,传统机器人算是白学了,仿佛 AI 真能包打天下。

同时,传统算法岗位的数量和待遇都在缩水,热门方向的薪资却实在诱人,比如今年就有硕士毕业生,能拿到近百万的 VLA 算法工程师 offer。这么看,好像不跟着时代洪流走,就只能被淘汰,焦虑感自然就跟着来了。

但我一直觉得,风水轮流转是真的。当下再深谋远虑的筹划,长远来看未必管用。虽然很多人可能会杠,先解决当下的生存问题,才有资格谈长远。我不否认这一点,也不否认短期来看,选对热点可以快速收获一波。

不过我更想跟青年学生讨论的是,从长期来看,什么样的策略、什么样的特质,能发展得更好。我自己比较相信,选什么不一定是最重要的,也没有永恒正确、一劳永逸的选择,避开明显的坑,挑一个「看起来靠谱」的方向,很多时候就足够了,剩下的关键,还得要看能不能在这个方向上做到极致,再带着终身学习的本事,随时灵活调整。

可以从就业、科研两方面都看一些例子。

就业方面,拿计算机专业举例(这里先叠个甲,无意冒犯,˶>ω<),2012 年后,移动互联网爆发、「互联网+」落地,计算机专业迎来黄金时期,高考分数线一路飙升,计算机专业录取分能比其他专业高一截。当时跨专业转码成风,不管什么专业都扎堆通过各种途径转码,条条大路通 CS。就业市场上,互联网大厂校招薪资连年上涨,本科生毕业甚至实习生就能拿到很高的薪资。当时我正好在上本科,也目睹了上海交大的计算机从冷门专业变得炙手可热,各路大神大多会在分专业时优先选 CS,有些同学甚至会说,最优秀的学生都在 CS(虽然我不同意,手动狗头)。

至于计算机现在怎么样,我就不多嘴了,不了解的可以自行搜索……

科研方面,大家肯定都知道何恺明大佬,现在 Google Scholar 引用快 80 万了,ResNet 引用超 30w。然而人家本科选的是物理、数学为主的基础科学班,跟 AI 学科还是有蛮大不同的。他真正接触 AI 是读研后,根据某些媒体报道,一开始因为非科班背景,看专业论文都有点费劲,也换过课题,但他没纠结一开始选对没选对,沉下心深耕,从图像去雾技术拿到 CVPR 最佳论文,再到提出残差网络 ResNet 打破深度学习的训练瓶颈,一步步成了 AI 领域顶尖学者。

所以说,一开始选什么未必影响那么大,更重要的是选了之后怎么做。一开始选得很好,后面也可能需要被迫转型。

其实现在,知道做什么方向火根本没有难度,大家都能刷到行业报告招聘薪资,在一些大的会议上逛两天,信息差就被抹平大半了。所有人都不傻,都会倾向热门的选择,可太多人都涌向同一个正确选择时,这个选择就变成了内卷的红海。而且今天的信息扩散越来越快了,最优路径的保质期越来越短。

更关键的是,大学是个延迟出结果的项目。今天选的好方向,有效期可能只有一两年,可读完硕士要 2-3 年,读完博士要 4-5 年,等毕业时,当初的最优解说不定早就凉了。再深谋远虑,也抵不过行业的快速变化。

所以不用太过于纠结选什么,更要想怎么把选的路走通。这里我想分享三个自己的思路:

第一,以热爱为锚点。

很多人选方向时总先问好不好就业,却忘了科研是场持久战——比如我们机器人专业,无人机调试要熬无数个夜,机械臂校准要反复试错,没有热爱根本撑不下去。我高中选机械工程,就是因为看了《钢铁侠》,觉得能造会飞的机甲太酷了;本科后期看了个 TED 演讲,里面的无人机能端酒杯、接网球,我一下子入了迷,博士果断转去做无人机研究,其实这个选择意味着要从机械专业跨到电子与计算机工程,需要很多从头学习。那时候也没人说无人机一定好就业,但我就是愿意花时间啃算法。我博士毕业时,一边是大厂的高薪 offer,一边是高校的研究岗位,最后选了高校,不是不想赚钱,是觉得和学生一起钻研无人机怎么像科幻电影一样探索未知空间更能让我兴奋。其实大家都有感受,很多看似冷门的行业里,都有顶尖人才。一个行业再好,你不喜欢、不擅长,也吃不到红利;一个行业再差,你极其热爱且有能力,也可能闯出一片天。

第二,以有用为导向。

机器人不是实验室里的炫技玩具,能解决真问题才有价值。工作后,虽然已经在高校,我又和伙伴创办公司,也是想把实验室的技术落地——比如我们做的工业无人机,能在地下洞穴里全自主完成精准测绘,给矿山工人省了无数危险、肮脏的工作;给学校做的教育无人机,能让学生接触并直接复现最前沿的科研成果。这就是有用的价值。科研的浪漫,从来不是公式多漂亮,而是能把论文里的理论,变成改变生活、行业的工具。做的东西能被需要、能创造价值,这才是最稳的护城河。

第三,把终身学习变成习惯。

我读机械时,发现无人机需要计算机和自动化知识,就自学编程、啃算法数据结构;博士做的是数学物理模型为主的感知和规划,这几年 AI 火了,又带着课题组学深度学习,把模型和 AI 结合;以前只研究无人机,现在也开始做无人车、四足机器人的协同。机器人领域变化很快——今天的「新技术」,明天可能就过时了。大学教你的从来不光是某门技术,是让头脑受过训练,有批判性思维、学习能力、沟通协作能力,这些才是穿越周期、抵御风险的核心资本。

科研路上没有最优解,今天选的方向可能不是最热门的,或者没有机会选到最热的方向,但答案不仅在「选什么」,还在于你每一次调试、每一篇论文、每一次愿意改变的勇气。


作为亲历者,你的 2025 是怎样的?

是一路升级突破,还是在压力中稳住阵脚?

有哪些瞬间让你意识到自己成长了,又有哪些挑战,成为你必须面对的问题?

「AI 中场时刻」活动正在进行中,欢迎分享属于你的年度总结——不论是高光、迷茫,还是转折。你的回答也许正是同行者在这个时代寻找方向的参考。

PS. 点击文末「阅读原文」或扫码查看↓完整版知乎科技年度策划《 AI-er 的2025 —— 在风口浪尖做点事》

图片

【声明】内容源于网络
0
0
知乎AI先行者
在智能之海寻找信标,航向未来。
内容 174
粉丝 0
知乎AI先行者 在智能之海寻找信标,航向未来。
总阅读38
粉丝0
内容174