大数跨境

2026,关于「具身有什么应用」的去魅要开始了

2026,关于「具身有什么应用」的去魅要开始了 知乎AI先行者
2025-12-18
0
导读:争完 github star,2026 年的焦点在项目现场

2025 年,对科技行业来说是快速变化、持续加速的一年。年关将至,知乎科技邀请 AI 行业的亲历者们分享自己的「 AI 中场时刻」 —— 不论是高光、迷茫,还是转折。

以期为更多同行者提供行业与人生的样本。

知友@Haoqiang Fan 在具身创业中,回顾今年 3 个震撼心灵的状况后,他对 2026 年的具身智能行业做了一些预测:

@Haoqiang Fan

清华姚班

原旷视 6 号员工、现具身智能创业中

TL;DR

2026 年,单看具身机器人这块应该还是有的搞的。回顾 2025 年,发生的几个趋势还是很震撼心灵的。

首先,就是有模型竟然是 work 的了

不说别的领域,就说图片生成这个「古典」赛道。之前诟病最多就是模型「凭空」生成的能力很强,但是要进行指定物体指定主体的强调控非常费劲,各种 lora 各种 controlnet 勉勉强强才能用。

但是现在看 flux.2 dev, qwen image edit,甚至开源免费的模型都还挺能打了,传两张图进去写个 prompt 就能合成,出来的图片的「ai 味」也没那么浓了。更不用提各种更牛的付费模型。

遥想在只有 SD 的时代,无数 paper 论证过图片合成的 faithfulness 是多么多么的难,生成的质量和保真度要 trade-off,现在看来都是怼的还不够用力,当成建制的人马杀进来天天搞数据合成数据清洗,这模型就还真的训出来了。

这种感觉就像是最早见识  Segment Anything Model ,问题的终点如此的朴实无华,一千一百万张精心标注的图片,无他。从此问题有了版本答案。

这种磅礴伟力的构造,并且更重要的是,其突破直观意义上的「work 和不 work」的边界的资源消耗量竟然是人力之所能及的,给人以深深震撼。

而这也是给「2025 年什么能火」立上了一个高高的门槛,就是这模型最好得是 work 的,而不是原来那种同样不 work 但是我比你高两个点的那种比较。

进展年年有,不过最激动人心的还是从「不能」突破到「能」的那年。


然后,就是有应用竟然有稳定的用户了

哪怕是我这种写代码习惯属于老古董的人了都不得不从 vim 转 vs code + copilot 了。之前写码全靠文档 api 大脑记得住,现在一个 transformers 库里一共定义了 9000 多个 class,已经不是人脑所能及的了,没点 ai 帮写查文档那是完全码不动了。

更不提 chatbot,每天嘴上念着 ai 各种幻觉各种 bug 不能轻易相信,等动手查点啥的时候还是自觉给 kimi 充了会员而不是继续去搜索引擎里找答案。还有overleaf 上的 writeful,第一次写文章不用找 native speaker 做 proof-read,会员费继续充起。

这些应用活下来了么?

从最早 LLM 只能搞情感陪聊,到现在真实的解决了一些生活中的问题,可以说现在这批 LLM 的用户以后是不太可能不去用它了。但问题是,从 OpenAI 开始这些做应用的公司有一个算一个都赔的飞起,这些 AI 应用产生的「价值」真的值去产生和持续服务它所消耗的资源了么?这可能是一个难以立即回答的问题。

回想当年,AI 1.0 正火之时,AI 小龙们集全国之人力物力把人脸识别磕到了一个不曾有过的高度,但后来又随着应用方向的变迁,这个领域一点点走出聚光灯。或许最终事物会回归到它该有的样子,在某个时间点之后,后世的人们可能最终只能继续享有不断降本后的产品。就像新款的超大杯手机里越来越少的配有 1 英寸传感器了。

应用有用户了,这本该是一件好事。但是最可怕的地方也就在此了,当一个产品真的有人做出来了,那么之前围绕着它的一切想象、一切增长曲线,就都有了一个现实的参照物。之后的发展路径有的时候就不再是由人的主观意志所能决定的了。


最后,就是社会对 ai 方向投入前所未有之大

曾经我还是习惯把一届会议里的文章一篇篇读一遍,来丰富一下自己的知识面和对领域的感知的。

现在…… 光是会议,一届动辄上万的文章,并且还有大量压根来不及投会议的 arxiv,更有甚者,连 arxiv 都来不及挂,一篇公司网站的 blog 就算是一篇 published work 了。

不过还是得感谢像 huggingface 这样的基建,好多工作就算是没咋看明白,也不耽误拿来用。以至于现在一篇工作,默认必须要有 github + project page + hf model 三件套,要不然满足不了读者们「碎片化复现 paper 」的需要了。

这种「卷」之象,其实之内核还是投入的总资源大。以前每年一版的技术迭代,现在成了每个月火一个新的 topic,可以说是全社会分布式科研的结果了。

很多人觉得现在做出有点水花的工作来「难」了。其实仔细想,每个人、每个课题组能够投入的时间精力还是那么多。但是做的人多了,maxpool 出来的工作那就都是「天时地利人和」buff 叠满了的,本来就是乘了一个系数。所以现在能看到的冒得出来泡的工作就都看着超人一般的厉害。


那么,为什么说 2026 年具身方向是有的搞的呢?

主要是……别的方向我可能更不太懂了

不过从具身机器人方向上看,明显是要有重演 2025年飞速发展的戏码:

  • 模型从不 work 到 work:Pi 05 的generalization 惊鸿一瞥,Pi 06 把大规模数采 + 模仿学习预训练 + 部署现场 fitting 的三大算法拼图已集全,就看谁来大力冲一把了!不管你在流派上是 UMI、仿真器、EgoData、远程遥操,明年使足力气去怼吧,明年到了你的「信仰」要用 work 了的模型来证明的年份了!

  • 应用从「好玩」到「有用」:可以预测,陆陆续续有一些「真有用」场景开始上一些 VLA 之类的「高级」方法了。关于具身有什么应用的第一波「去魅」要开始了。2025 年可能比的是 github star,2026 年争夺的焦点可能真的要去项目现场了……

  • 社会投入与关注:各地数采中心都建起来要发动了,算力集群已经交付到融饱了资金的创业公司手里了,代工厂们接了单要开始交货了……可能最终还是要问那个问题,就是「这一切是否已经值得」,但是可以想见明年具身圈的「卷」显然是要超过今年的。社会的总投入和总热情再次来到一个高峰。


风口浪尖就一定是好事吗?

或许也不一定。

但是风口的时期其实是去做一些事情的好时候……

毕竟,万一,搞出来点啥了呢?


作为亲历者,你的 2025 是怎样的?

是一路升级突破,还是在压力中稳住阵脚?

有哪些瞬间让你意识到自己成长了,又有哪些挑战,成为你必须面对的问题?

「AI 中场时刻」活动正在进行中,欢迎分享属于你的年度总结——不论是高光、迷茫,还是转折。你的回答也许正是同行者在这个时代寻找方向的参考。

点击「阅读原文」,查看原回答、分享你的 AI 年度总结

【声明】内容源于网络
0
0
知乎AI先行者
在智能之海寻找信标,航向未来。
内容 174
粉丝 0
知乎AI先行者 在智能之海寻找信标,航向未来。
总阅读8
粉丝0
内容174