GEIA行业群
加入GEIA具身智能行业群,请添加微信18916565701,主动出示名片,仅限具身智能及机器人产业链相关企业。
*120+具身智能与人形机器人行业报告合集~ 转发本文章至朋友圈截图发给GEIA小助理即可免费领取~ 文末添加小助理微信!
6月30日,跨维智能官宣完成10亿元B轮融资,投后估值超百亿元,成为具身世界模型赛道的新晋百亿独角兽。更值得关注的是,这笔融资之后,跨维即将启动IPO。
投资方名单同样亮眼:深创投、前海母基金、恒健资本、工银资本等头部财投入局,蓝思科技等产业资本加持,贵阳数字经济基金等地方国资参与,老股东南山战新投、成都科创投、四川院士基金持续加码。
这不是一家靠讲故事堆估值的公司。2025年,跨维智能营收已经突破亿元;2026年上半年营收1亿元,全年预计增长3-4倍,冲刺3亿元。在普遍还在烧钱的具身智能赛道,这样的商业化成绩格外突出。
更有意思的是它的技术路线。当行业纷纷押注VLA(视觉-语言-动作)模型时,跨维智能选择了一条不同的路——生成式仿真。创始人贾奎直言不讳:VLA的本质是捷径学习,学习效率比正确的建模方式低几千倍甚至几万倍。
这匹从深圳跑出来的黑马,到底凭什么?
贾奎:从终身教授到百亿公司CEO
跨维智能的故事,要从创始人贾奎说起。
贾奎是典型的学术出身创业者。他本科毕业于西北工业大学,硕士在新加坡国立大学,博士在伦敦大学,后来成为香港中文大学(深圳)数据科学学院的终身教授,连续五年入选斯坦福全球Top 2%顶尖科学家。
早在2016年,贾奎就率队搭建了几何感知与智能实验室。那时候AI行业的主流是处理二维图像,但他的团队从一开始就锚定了一个更难的方向:三维空间感知和生成。这个判断,后来成了跨维智能的技术原点。
2018年前后,团队越来越清晰地意识到一个问题:三维感知的瓶颈不是算法,是数据。真实数据采集成本高、标注难、场景覆盖有限。第一性原理决定了,除了真实数据以外,合成数据和Sim2Real(从仿真到现实)体系是关键抓手。
这个判断在当时显得有些另类。毕竟那时候大语言模型还没火,具身智能更是一个小众概念。但贾奎相信,通用AI的终局是物理AGI——让AI走出屏幕,进入真实的物理世界。而要实现这个目标,机器人必须先在虚拟世界完成海量训练,再迁移到现实世界。
2021年,跨维智能在深圳南山成立。从实验室到创业公司,贾奎的身份从教授变成了CEO,但核心目标没变:用AI打通三维世界感知、决策、执行的每一个环节,构建一条通往物理AGI的可持续道路。
五年下来,跨维智能打造了一套全栈自研的四层产品矩阵:底层是DexVerse™生成式仿真具身引擎,往上是DexSense空间智能传感器和DexBrain具身智能大脑软件,最上层是DexForce W1人形机器人本体。从软件到硬件,从仿真到真机,形成了一个完整的虚实协同技术闭环。
这套闭环,最终转化成了实实在在的营收和客户。
⏰️与具身智能赛道的一线创业者、投资人深度交流,扫码报名9月GEIA GBA粤港澳大湾区具身智能与人形机器人创新周↓
不走VLA路线,生成式仿真才是答案?
在具身智能领域,VLA几乎成了行业标配。但跨维智能从一开始就没走这条路。
贾奎认为,VLA的本质是"捷径学习"——看见图像、听到语言指令后直接输出动作,中间不经过真正的三维推理。这种模式在泛化学习上效率极低,跟正确的建模方式比,可能差出几千倍甚至几万倍。
这是因为,物理世界是三维的,不是二维照片。机器人要理解的不是像素,而是空间关系、物理规律和物体交互。纯粹基于视觉的VLA模型,本质上是在二维像素空间里做拟合,没有真正理解三维物理世界的运行规律。
所以跨维选择了另一条路:生成式仿真(Generative Simulation)。
简单说,就是用AI自动生成海量的三维虚拟场景,让机器人在虚拟世界里训练,然后再把能力迁移到真实世界。这条路线的核心优势是数据效率——
传统的真机遥操方式,一个操作员一天只能采集100到150条数据。按照这个速度,要解决具身智能的通用泛化问题,可能需要十万年。而在仿真环境中,数据可以无限生成,成本几乎可以忽略不计。
但贾奎特别强调,具身智能引擎和物理仿真是两回事。成熟的底层物理仿真技术在工业界已经存在几十年了,刚体、软体、流体的模拟精度都很高。具身智能缺的不是这些,而是如何把物理仿真形成的任务场景、虚拟传感器产生的数据、模型训练、再到本体部署,高效自动化地连接起来。
跨维自研的DexVerse™具身智能引擎,解决的就是这个"全链条自动化"的问题。给一张图片或者一句语言描述,系统就能自动生成任务环境,然后由AI Agent自动组织机器人在虚拟世界中完成任务、产生数据、训练模型。
这个效率有多高?在半结构化的泛智能制造场景下,从造数据到训模型,再到真机部署,只需要6到8个小时。而传统方式可能需要几周甚至几个月。
在此基础上,跨维还推出了自己的世界模型DexWorldModel。和市面上很多基于视频生成的世界模型不同,跨维的世界模型有两个核心设计:
一是Latent Space采用Space-Time表征,直接在三维物理空间生成机器人动作,而不是生成给人看的RGB视频帧;二是DexBEV技术,把自动驾驶领域的BEV(鸟瞰视图)概念升维到三维物理世界,将视觉、力觉、触觉、电机信号等多源异构数据统一到一个坐标空间下。
据说DexBEV发布一周后,阿里就发布了高度相似的方案。这也从侧面说明,行业确实在往这个方向收敛。
2026年上半年,跨维智能的具身世界模型拿下了WorldArena Track 2的冠军。这个成绩,算是对他们技术路线的一个阶段性验证。
3 年入3亿,具身智能最会赚钱的公司
技术说得再天花乱坠,最终还是要落地赚钱。在这一点上,跨维智能可能是具身智能行业里最"接地气"的公司。
他们的业务分成两条线:
一条是工业赋能。用AI模型能力赋能第三方工业臂、协作臂,解决智能制造中的分拣、装配、插拔等问题。说白了,就是给传统机械臂装上"大脑"和"眼睛",让它们能处理更复杂、更柔性的任务。
这条线的客户名单相当硬核:美的、广汽、蓝思科技、中国中车、五菱……都是实打实的制造业龙头。场景覆盖电子制造的PCB板检测分拣、3C产品柔性装配,物流仓储的混合SKU无序抓取、快递包裹分拣,汽车制造的线束插拔、多工位柔性装配,还有食品医药、纺织服装等领域的高难度灵巧操作。
另一条线是人形机器人。跨维有自己的人形机器人产品DexForce W1系列,走的是"DexBot Inside"模式——把搭载技能模型的本体卖给商业运营商,由合作伙伴自主运营获利。2026年上半年,他们的人形机器人出货量是数百台,全年目标是1000台。
两条线加起来,2025年营收突破亿元,2026年上半年就做了1个亿,全年预计增长3到4倍。这个增速在整个硬科技领域都相当可观。
更有意思的是他们的收费模式。贾奎提出了一个"Physical Token经济学"的概念——就像大语言模型按Token调用次数收费一样,以后机器人也可以按"干活量"收费。客户把机器人本体买回去,然后按实际消耗的物理Token付费。如果机器人能给客户带来增量价值,甚至可以从增量价值中分成。
这是一个很有想象力的商业模式。如果能跑通,意味着机器人公司从卖硬件的一锤子买卖,变成了持续产生收入的订阅制生意。
当然,挑战也同样真实存在。
生成式仿真路线虽然数据效率高,但"现实鸿沟"(Reality Gap)始终是绕不开的问题——虚拟世界再逼真,和真实世界还是有差距。如何让仿真训练出来的模型在真实世界中同样好用,是所有走Sim2Real路线的公司都必须面对的考验。
竞争也在加剧。一方面是智元、宇树、优必选等同行在快速推进,另一方面是大模型公司往下沉、传统机器人公司往上走,赛道越来越拥挤。技术代差会不会被快速抹平,没人能打包票。
人形机器人的商业化落地,更是一个全行业都在摸索的命题。几百台的出货量虽然领先,但距离真正的规模化还有很远的路要走。价格、性能、场景,每一个都是坎。
不过,这些问题显然没有阻挡资本的热情。10亿融资、百亿估值、即将IPO——市场用真金白银给跨维智能投了票。
贾奎常说一句话:"行业已经发展了两三年,大家不能一直停留在demo展示,总要拿出能够解决问题的产品和业务结果。"
从这个角度看,跨维智能可能不是技术最酷炫的那家,但一定是最务实的那批之一。当具身智能的潮水慢慢退去,真正能创造价值的公司才会浮出水面。
而跨维,已经跑在了前面。
订阅号丨GEIA全球具身智能观察
服务号丨GEIA全球具身智能创新周

