2026，关于「具身有什么应用」的去魅要开始了- 大数跨境

首页

2026，关于「具身有什么应用」的去魅要开始了

知乎AI先行者

2025-12-18

导读：争完 github star，2026 年的焦点在项目现场

2025 年，对科技行业来说是快速变化、持续加速的一年。年关将至，知乎科技邀请 AI 行业的亲历者们分享自己的「 AI 中场时刻」 —— 不论是高光、迷茫，还是转折。

以期为更多同行者提供行业与人生的样本。

知友@Haoqiang Fan 在具身创业中，回顾今年 3 个震撼心灵的状况后，他对 2026 年的具身智能行业做了一些预测：

@Haoqiang Fan

清华姚班

原旷视 6 号员工、现具身智能创业中

TL;DR

2026 年，单看具身机器人这块应该还是有的搞的。回顾 2025 年，发生的几个趋势还是很震撼心灵的。

首先，就是有模型竟然是 work 的了

不说别的领域，就说图片生成这个「古典」赛道。之前诟病最多就是模型「凭空」生成的能力很强，但是要进行指定物体指定主体的强调控非常费劲，各种 lora 各种 controlnet 勉勉强强才能用。

但是现在看 flux.2 dev, qwen image edit，甚至开源免费的模型都还挺能打了，传两张图进去写个 prompt 就能合成，出来的图片的「ai 味」也没那么浓了。更不用提各种更牛的付费模型。

遥想在只有 SD 的时代，无数 paper 论证过图片合成的 faithfulness 是多么多么的难，生成的质量和保真度要 trade-off，现在看来都是怼的还不够用力，当成建制的人马杀进来天天搞数据合成数据清洗，这模型就还真的训出来了。

这种感觉就像是最早见识 Segment Anything Model ，问题的终点如此的朴实无华，一千一百万张精心标注的图片，无他。从此问题有了版本答案。

这种磅礴伟力的构造，并且更重要的是，其突破直观意义上的「work 和不 work」的边界的资源消耗量竟然是人力之所能及的，给人以深深震撼。

而这也是给「2025 年什么能火」立上了一个高高的门槛，就是这模型最好得是 work 的，而不是原来那种同样不 work 但是我比你高两个点的那种比较。

进展年年有，不过最激动人心的还是从「不能」突破到「能」的那年。

然后，就是有应用竟然有稳定的用户了

哪怕是我这种写代码习惯属于老古董的人了都不得不从 vim 转 vs code + copilot 了。之前写码全靠文档 api 大脑记得住，现在一个 transformers 库里一共定义了 9000 多个 class，已经不是人脑所能及的了，没点 ai 帮写查文档那是完全码不动了。

更不提 chatbot，每天嘴上念着 ai 各种幻觉各种 bug 不能轻易相信，等动手查点啥的时候还是自觉给 kimi 充了会员而不是继续去搜索引擎里找答案。还有overleaf 上的 writeful，第一次写文章不用找 native speaker 做 proof-read，会员费继续充起。

这些应用活下来了么？

从最早 LLM 只能搞情感陪聊，到现在真实的解决了一些生活中的问题，可以说现在这批 LLM 的用户以后是不太可能不去用它了。但问题是，从 OpenAI 开始这些做应用的公司有一个算一个都赔的飞起，这些 AI 应用产生的「价值」真的值去产生和持续服务它所消耗的资源了么？这可能是一个难以立即回答的问题。

回想当年，AI 1.0 正火之时，AI 小龙们集全国之人力物力把人脸识别磕到了一个不曾有过的高度，但后来又随着应用方向的变迁，这个领域一点点走出聚光灯。或许最终事物会回归到它该有的样子，在某个时间点之后，后世的人们可能最终只能继续享有不断降本后的产品。就像新款的超大杯手机里越来越少的配有 1 英寸传感器了。

应用有用户了，这本该是一件好事。但是最可怕的地方也就在此了，当一个产品真的有人做出来了，那么之前围绕着它的一切想象、一切增长曲线，就都有了一个现实的参照物。之后的发展路径有的时候就不再是由人的主观意志所能决定的了。

最后，就是社会对 ai 方向投入前所未有之大

曾经我还是习惯把一届会议里的文章一篇篇读一遍，来丰富一下自己的知识面和对领域的感知的。

现在…… 光是会议，一届动辄上万的文章，并且还有大量压根来不及投会议的 arxiv，更有甚者，连 arxiv 都来不及挂，一篇公司网站的 blog 就算是一篇 published work 了。

不过还是得感谢像 huggingface 这样的基建，好多工作就算是没咋看明白，也不耽误拿来用。以至于现在一篇工作，默认必须要有 github + project page + hf model 三件套，要不然满足不了读者们「碎片化复现 paper 」的需要了。

这种「卷」之象，其实之内核还是投入的总资源大。以前每年一版的技术迭代，现在成了每个月火一个新的 topic，可以说是全社会分布式科研的结果了。

很多人觉得现在做出有点水花的工作来「难」了。其实仔细想，每个人、每个课题组能够投入的时间精力还是那么多。但是做的人多了，maxpool 出来的工作那就都是「天时地利人和」buff 叠满了的，本来就是乘了一个系数。所以现在能看到的冒得出来泡的工作就都看着超人一般的厉害。

那么，为什么说 2026 年具身方向是有的搞的呢？

主要是……别的方向我可能更不太懂了

不过从具身机器人方向上看，明显是要有重演 2025年飞速发展的戏码：

模型从不 work 到 work：Pi 05 的generalization 惊鸿一瞥，Pi 06 把大规模数采 + 模仿学习预训练 + 部署现场 fitting 的三大算法拼图已集全，就看谁来大力冲一把了！不管你在流派上是 UMI、仿真器、EgoData、远程遥操，明年使足力气去怼吧，明年到了你的「信仰」要用 work 了的模型来证明的年份了！
应用从「好玩」到「有用」：可以预测，陆陆续续有一些「真有用」场景开始上一些 VLA 之类的「高级」方法了。关于具身有什么应用的第一波「去魅」要开始了。2025 年可能比的是 github star，2026 年争夺的焦点可能真的要去项目现场了……
社会投入与关注：各地数采中心都建起来要发动了，算力集群已经交付到融饱了资金的创业公司手里了，代工厂们接了单要开始交货了……可能最终还是要问那个问题，就是「这一切是否已经值得」，但是可以想见明年具身圈的「卷」显然是要超过今年的。社会的总投入和总热情再次来到一个高峰。