大数跨境
0
0

“机器人一次性卖完太亏!”真机智能刘智勇:今年中国本体厂商将大淘汰,拼的是世界模型?

“机器人一次性卖完太亏!”真机智能刘智勇:今年中国本体厂商将大淘汰,拼的是世界模型? AI前线
2026-01-10
7
导读:2026 年本体厂商肯定会收缩,估计中国最终只会剩下 5 到 8 家本体机器人公司。
作者 | 华卫
本文为《2025 年度盘点与趋势洞察》系列内容之一,由 InfoQ 技术编辑组策划。本系列覆盖大模型、Agent、具身智能、AI Native 开发范式、AI 工具链与开发、AI+ 传统行业等方向,通过长期跟踪与业内专家深度访谈,系统梳理关键技术进展、核心事件及产业趋势。内容将在 InfoQ 媒体矩阵陆续发布。

真机智能董事长兼首席科学家刘智勇指出,2025 年具身智能领域最显著的突破集中在视觉语言导航(VLN)与世界模型两大方向。他强调,一旦世界模型在因果推理能力上取得突破,机器人安全性、行为可解释性及推理可靠性问题将迎刃而解。

“2026 年本体厂商将加速整合,中国预计仅存 5 到 8 家具备持续交付能力的本体机器人公司。”刘智勇表示,关键胜负手在于能否在单一垂直场景中实现真正意义上的净盈利——即不依赖高额售后成本、可持续的正向现金流。整机销售模式面临售后压力大、用户支付门槛高等挑战,“整机销售 + 年度服务费”已成为更优路径;未来按单计费的轻资产模式亦具可行性。

VLN 和世界模型:技术范式跃迁

VLN 和世界模型上“大分”
Q:2025 年具身智能领域有哪些突破性进展?是否已为特定场景初步普及奠定基础?

刘智勇: VLN 是今年最具代表性的技术突破。相比传统以 SLAM 为核心的几何导航范式,VLN 依托视觉-语言多模态输入,实现了真正的零样本泛化能力——无需预建地图,机器人即可在全新固定场景中自主完成门到门配送任务。UniNavid、ETPNav、FSR-VLN 等代表性工作已验证该路径的工程可行性。其核心价值在于大幅降低部署成本(目前占整机售价约 38%),从而推动成本结构适配场景化盈利模式,为规模化落地扫清关键障碍。

Q:具身智能核心技术栈正在如何演变?2025 年有哪些新范式或共识?

刘智勇: 算法层面正从“感知-决策-执行”分离的模块化架构,转向 VLN/VLA 端到端统一范式;数据层面,由纯真实采集转向合成数据、离线轨迹挖掘与世界模型协同驱动;训练范式则从强化学习调参,升级为世界模型引导的预测式学习。世界模型已成为行业解决数据稀缺、corner case 覆盖与长程状态模拟的主流共识。

Q:世界模型对机器人实际能力提升体现在哪些方面?未来潜力何在?

刘智勇: 现阶段三大作用明确:一是增强长程任务规划能力,缓解短视困境;二是动态环境适应,通过预测移动物体轨迹保障本地行动安全;三是弥合数据泛化鸿沟,高效生成高质量训练样本。但当前瓶颈在于其“黑盒”特性——缺乏白盒可微性,制约调试与可控性提升。

Q:大模型快速发展为具身智能带来哪些质变?

刘智勇: 最根本的质变是导航范式从 SLAM 向 VLN 的迁移。SLAM 依赖静态地图、高精度传感器标定且无语义理解能力;VLN 则融合视觉与语言,实现语义级环境理解,支持动态适配,摆脱激光雷达与预部署地图依赖,在成本、部署效率与场景泛化性上实现跃升。当前核心难点在于统一行动、观测与语言三个异构空间。

大规模落地的现实卡点

大规模落地现在卡在哪儿?
Q:高质量物理交互数据稀缺是最大瓶颈,仿真数据、人类视频等替代方案能走多远?“数据工厂”是否可行?

刘智勇: 当前数据瓶颈集中在两方面:一是场景覆盖不足,主流数据集如 Matterport3D、Habitat、AI2THOR 均基于有限封闭环境构建;二是采集与标注成本高昂,3D 数据标注难度较 2D 图像高出一个数量级。

应对策略呈三层结构:一是持续采集真实 RGBD 视频流及数字手套数据,并辅以人工指令标注;二是利用仿真器批量生成视觉-语言-轨迹三元组;三是探索“静态片段重写”新范式,在不改动 3D 环境前提下高效扩展样本。离线轨迹挖掘亦为重要演进方向。

Q:当前硬件(灵巧手、关节驱动、传感器等)在哪些方面满足需求?又构成哪些主要制约?

刘智勇: 进步显著:一体化关节、灵巧手与触觉传感器使机器人具备开单元门、按电梯等精细操作能力,标志着从轮式移动向人形具身的关键跨越。

但硬件短板依然突出:一是高分辨率柔性触觉皮肤缺失,导致盲按电梯成功率低;二是门把手类型繁多,缺乏触觉反馈则难以泛化适配;三是电机、丝杠等执行部件在高频反复操作下的耐疲劳性与反脆弱性不足。开门能力与触觉性能是当前硬件攻坚重点。

Q:制约具身智能大规模落地的核心难题还有哪些?

刘智勇: VLN 落地存在两大硬约束:一是感知-决策延迟问题,在开放环境中可能导致致命响应滞后,亟需端侧轻量化部署;二是硬件性能短板,既要高灵敏度感知,又要高鲁棒性执行,现有部件的耐久性尚不达标。世界模型层面,隐式神经表征仍难支撑开门、按键等任务所需的精准几何信息表达。

具身智能商业模式重构

具身智能该告别 “一锤子买卖”?
Q:真机智能接下来一年的战略重点和核心发力方向是什么?

刘智勇: 北京真机聚焦传统 SLAM+轮式机器人方案,苏州真机主攻 VLN+人形机器人技术路线。后者两大攻坚方向为:一是实现零样本门到门配送,彻底取消预建图环节;二是突破全身运动控制,以动态平衡替代静态假设,提升开门、按电梯等动作的泛化性与成功率。二者结合,即可在无 GPS、无建图条件下完成“最后五公里”的全链路室内配送。

Q:除了整机销售,具身智能未来还有哪些商业模式创新?

刘智勇: “整机销售 + 年度服务费”是当前最可持续的模式,兼顾厂商回款周期与用户成本压力,将一次性硬件生意转化为长期现金流业务。按单计费模式亦具潜力,例如人形配送机器人单次成本可压至 2–3 元,与达达等平台合作可形成规模效应。

本体厂商洗牌与决胜逻辑

本体厂商大收缩,要拼什么?
Q:2026 年具身智能有望在能力边界上实现哪些突破?技术决胜点会落在何处?

刘智勇: 两大突破方向清晰:一是非结构化场景下的稳定作业能力,需兼具社交行为表现与自主导航能力;二是攻克莫拉维克悖论——让机器人胜任人类习以为常的简单物理任务。技术决胜点在于世界模型的因果推理能力,该能力一旦突破,将系统性提升机器人安全性、可控性与行为可解释性。

Q:2026 年全球具身智能竞争格局将如何演化?中国公司与国际巨头的核心优势与赛点分别在哪?

刘智勇: 本体厂商将加速出清,马太效应加剧,中国最终或仅剩 5–8 家头部企业。国际企业在大模型底层能力上领先,中国则胜在供应链成本优势与场景落地速度。2026 年竞争维度将从单点技术先进性,全面转向系统级效率——谁能率先在单一场景实现可持续净盈利,谁就能构建数据飞轮,进而支撑跨场景复制与迭代进化。

【声明】内容源于网络
0
0
AI前线
面向AI爱好者、开发者和科学家,提供大模型最新资讯、AI技术分享干货、一线业界实践案例,助你全面拥抱AIGC。
内容 8042
粉丝 0
AI前线 面向AI爱好者、开发者和科学家,提供大模型最新资讯、AI技术分享干货、一线业界实践案例,助你全面拥抱AIGC。
总阅读61.1k
粉丝0
内容8.0k