点击关注
已关注公众号
2026年的具身智能赛道,早已不是概念狂欢,而是技术落地、资本加注、场景爆发的硬核比拼。
IDC数据显示,2025年全球人形机器人出货量同比暴涨508%,中国具身智能市场规模直奔万亿级,一季度融资总额超318亿元,平均每天近2起融资、超3亿资金涌入。
在这场资本与技术的双重浪潮中,一家成立仅一年多的创业公司:影身智能,凭借三个月连续完成天使轮、天使+轮、Pre‑A轮,累计融资近亿元的战绩,从清华实验室与阿里产业经验中杀出重围,成为行业最受瞩目的黑马。
这不是普通的早期融资,而是头部产业资本、知名VC、重磅国资平台集体下注的结果:天使及天使 + 轮由恒生电子领投,松禾资本、杭州润苗基金、北京未来星、东莞人才基金联合投资;Pre‑A轮由深高投领投,晓池资本与老股东卓源亚洲共同参与。加上2024年数千万元种子轮,影身智能在短短一年多时间里,完成从种子到Pre‑A的四级跳,用资本认可度证明:真正解决物理世界理解难题的技术,永远不缺市场买单。
更难得的是,影身智能没有陷入 “融资即烧钱、炫技不落地” 的硬科技通病,而是一边突破技术瓶颈,一边拿下双柔性制造场景千万级订单,成为国内首个实现具身智能柔性智造大单落地的企业。在AI大模型从虚拟走向实体、机器人从实验室走向工厂的关键节点,影身智能的崛起,不是偶然,而是一场从技术底层、团队基因到商业路径的全面胜利。
前阿里机器人负责人+清华天团:为什么团队能跑出加速度?
一家硬科技公司的上限,往往由创始团队的科研深度 + 产业厚度共同决定。影身智能之所以能在短时间内连获融资、突破技术,核心在于它打造了一支学术界顶流 + 产业界老兵的黄金组合,既懂实验室里的底层创新,又懂工厂里的落地逻辑。
创始人兼CEO闵伟博士,是典型的学霸 + 实战派双料选手。他拥有清华大学工学背景,在机器人领域深耕超过20年,更关键的是,他曾担任阿里巴巴机器人团队技术负责人,从0到1搭建阿里本地生活配送机器人体系,推动机器人在医院、酒店、办公楼等场景规模化运营落地,亲眼见证过机器人从技术原型到商业产品的全过程,深知实验室里的完美算法,到了真实场景会遇到多少坑。
这种 “从科研到产业” 的完整经验,让闵伟在创业之初就避开了很多硬科技企业的误区:不追求参数堆砌,不沉迷Demo展示,而是以真实场景需求倒推技术研发,把每一行代码、每一个硬件模块,都锚定 “能用、好用、便宜用” 的目标。
在闵伟背后,是影身智能的清华科学家天团 —— 由国家杰出青年科学基金获得者、“万人计划” 领军人才领衔,成员均来自清华大学,研究方向覆盖动态3D视觉与空间重建、复杂机器人运动控制、视触觉多模态感知等具身智能核心环节。这支团队不是简单的学术顾问,而是深度参与全栈研发,从动态三维重建理论到机器人运控算法,从空间物理建模到多模态感知融合,构建起从看见、理解到行动的完整技术链条,为影身智能的底层技术突破提供了不可复制的科研支撑。
与此同时,影身智能的CTO、COO及多位副总裁,均来自阿里、吉利、美团、京东、顺丰等大厂核心业务部门,覆盖算法研发、硬件量产、供应链管理、客户拓展等商业化全环节。这支团队懂量产、懂成本、懂交付,能把清华实验室里的前沿技术,快速转化为工厂能落地、客户买得起的产品,精准打通通用物理智能规模化落地的 “最后一公里”。
在具身智能行业,懂技术的不懂产业,懂产业的缺底层技术是普遍痛点。而影身智能的团队,恰好补齐了这一短板:科学家负责突破技术天花板,产业老兵负责守住商业底线,两者结合,让影身智能从成立第一天起,就走上技术与商业双轮驱动的正轨,这也是资本愿意连续加注的核心原因。
原生3D动态世界模型,到底解决了什么行业死穴?
当下具身智能行业,看似热闹非凡,实则藏着一个致命底层难题:机器人根本无法真正理解三维物理世界。
目前行业主流技术路线,存在两大先天缺陷:一是大语言模型(LLM)路线,完全基于文本数据抽象建模,只擅长语义和逻辑,对视觉、触觉等多模态感知毫无办法,更别说理解三维空间、物体结构和物理受力;二是2D VLA视频模型路线,看似能处理视觉信息,本质还是在二维图像序列里打转,通过间接映射模拟三维世界,一旦遇到复杂空间关系、物体接触、动态受力,就会出现空间错位、物理幻觉,根本无法支撑机器人在真实环境里稳定操作。
简单说,现有技术都是用二维思维解决三维问题,就像让盲人靠触摸描述一座山,永远只能得到局部、模糊的认知,无法形成完整、精准的物理世界理解。这也是为什么很多机器人在实验室里表现完美,一到工厂柔性场景就频繁出错,难以规模化落地。
针对这一行业死穴,影身智能从成立之初就定下差异化技术路径:不做二维映射的改良,直接从数据源头构建原生3D动态世界模型,用全栈自研技术,让机器人实现从 “看见像素” 到 “理解物理” 的升维进化。
这款原生3D动态世界模型,核心创新在于彻底抛弃二维间接映射,以原生 3D 数据为基础,重构模型能力边界。它能精准建模三维拓扑结构、深度信息和接触力场,同步完成三大核心能力:生成场景三维几何表征、预测动态视频、直接驱动物理机器人的动作序列,真正实现视觉-4D-动作的一体化闭环。
为了让大家更直观理解,我们可以打个比方:传统2D路线,相当于给机器人看二维照片,让它猜测物体的厚度、重量和受力;而影身智能的原生3D路线,相当于给机器人装上三维透视眼,直接看到物体的完整结构、空间位置和物理属性,就像人类一样,不用思考就能知道 “这个物体能不能抓、从哪个角度抓、用多大力气抓”。
这种技术突破,不是简单的性能提升,而是底层逻辑的颠覆:
1、解决物理一致性难题:传统模型容易出现 “抓空、抓歪、抓坏” 的问题,原生3D 模型通过精准物理建模,让机器人动作符合真实物理规则,大幅降低操作失误率;
2、打破泛化能力瓶颈:传统机器人需要针对每个场景重新训练,原生 3D 模型具备物理常识泛化能力,能快速适配新场景、新物体,不用重复标注数据;
3、降低技术落地门槛:通过 “V‑4D‑A” 架构,打通3D数据获取、模型训练、本体运行、场景落地的全链路,让具身智能不再是大厂专属,中小企业也能用上。
在技术架构上,影身智能以V‑4D‑A(视觉-4D-动作) 为核心引擎,构建起软硬一体化产品矩阵:前端有实时3D数据采集系统 “影身360”,核心是原生3D动态世界模型S1,执行端是柔性生产机器人,形成数据 - 模型 - 应用的正向飞轮,从技术底层解决具身智能 “看不懂、做不稳、用不起” 的三大痛点。
低成本破局数据瓶颈!影身360如何让3D数据不再昂贵?
具身智能行业还有一个绕不开的痛点:3D数据获取成本太高、效率太低。
传统3D数据采集,依赖激光雷达、深度相机等高成本传感设备,一套设备动辄数万元,数据采集和重建流程复杂,耗时耗力,直接推高机器人研发和落地成本,让很多中小企业望而却步。这也是具身智能难以规模化普及的关键原因 ——数据成本,成为行业规模化的天花板。
影身智能的核心远见,在于不跟同行拼硬件成本,而是用技术创新降低数据成本。针对行业数据瓶颈,公司推出影身360实时3D数据采集系统,基于消费级RGB摄像头,就能实现三维数据的实时采集与重建,大幅降低对高成本传感设备的依赖。
这套系统的价值,不止于 “便宜”,更在于高效、可规模化:
● 硬件门槛极低:不用昂贵专业设备,普通摄像头就能完成采集,适合工厂大规模部署;
● 采集效率极高:实时完成3D重建,不用后期人工处理,大幅缩短模型训练周期;
● 成本大幅下降:数据获取成本降低后,机器人训练成本、落地成本同步下降,让具身智能真正走向普惠。
技术再牛,最终要靠商业落地证明价值。影身智能没有选择跟风做人形机器人炫技,而是精准切入轻工业双柔性制造场景—— 柔性制造 + 柔性材料,这是传统自动化领域最难攻克的环节,也是人工替代需求最迫切、市场空间最大的赛道。
为什么选双柔性制造?传统自动化生产线,都是 “刚性” 设计,只能生产单一产品,换线成本高、周期长,适合大批量、标准化生产。但轻工业里的制鞋、服装、电子组装等场景,都是多品种、小批量、柔性工序,产品款式频繁更换,材料柔软易变形,传统机器人根本无法适应,只能依赖大量人工,效率低、成本高、品质不稳定。
这类场景,恰恰是具身智能的最佳用武之地—— 需要机器人具备感知、理解、自适应操作能力,而这正是影身智能原生3D技术的核心优势。
影身智能的解决方案,核心逻辑是把人工经验转化为数据资产:通过对人工操作过程进行3D建模,将老师傅的操作手法、力度控制、角度调整等经验,转化为模型可学习的数据,再通过原生3D动态世界模型,驱动机器人精准复现这些操作,实现柔性工序自动化。
目前,这套方案已在制鞋等核心柔性场景完成商业化闭环,拿下数千万级产业订单,成为国内首个具身智能柔性智造大单。这不是简单的试点应用,而是可复制、可规模化的商业验证:
-
● 降低企业改造成本:不用更换原有产线,模块化部署,投入少、见效快; -
● 提升生产效率:机器人24小时稳定作业,品质一致性大幅提升,减少人工误差; -
● 形成数据飞轮:每一次作业都会产生新数据,反哺模型优化,让机器人越来越聪明。 -
松禾资本合伙人汪洋评价:影身智能凭借原生3D动态世界模型,在感知推理上实现代际领先,构建了极具成本优势的泛化路径,已在制鞋等复杂领域率先完成算法至整机的闭环验证,在全球劳动力变革背景下,其 “深耕垂直、逐步外延” 的战略极具价值。
从实验室到工厂,从技术原型到千万订单,影身智能用实际行动证明:具身智能的未来,不是造炫酷的机器人,而是解决真实产业痛点。只有扎根产业、创造价值,才能走得更远、更稳。
很多人以为,影身智能只是一家做工业柔性机器人的公司,其实不然。原生3D动态世界模型的价值,远不止于工业场景,它是一条通往通用物理智能的完整路径,未来将跨越物理鸿沟,覆盖工业、服务、商业、家庭全场景。
技术拓展的核心逻辑,在于底层能力的通用性:原生 3D 动态世界模型解决的是机器人如何理解物理世界的终极问题,不管是工厂里的柔性装配,还是家庭里的扫地、做饭,本质都是机器人与三维物理世界的交互。只要底层建模能力足够强、泛化能力足够好,就能快速适配不同场景,不用重新研发核心技术。
具体来看,影身智能的技术拓展路径清晰可见:
● 深耕轻工业柔性制造:持续优化制鞋、服装、电子组装等场景,扩大市场份额,打磨产品成熟度;
● 延伸至商业服务场景:进入物流分拣、酒店服务、零售配送等领域,用低成本具身智能方案,替代重复人工;
● 布局家庭C端场景:未来逐步推出家庭服务机器人,实现家务打理、老人陪护等功能,让具身智能走进日常生活。
这种拓展,不是盲目多元化,而是基于核心技术的自然延伸。就像智能手机从通讯工具变成生活中心,影身智能的原生3D技术,从工业大脑开始,逐步成为所有物理智能体的核心,最终构建起通用物理智能生态。
在全球具身智能竞争中,中国企业一直面临底层技术缺失、核心算法受制的问题。而影身智能的原生3D动态世界模型,是中国团队在具身智能底层架构上的原创性突破,从数据源头、模型架构到应用落地,实现全栈自研,不依赖国外技术,为中国具身智能产业抢占全球制高点,提供了关键支撑。
站在2026年这个具身智能规模化落地的元年,回看影身智能的成长路径,我们能清晰看到中国硬科技创业的正确打开方式,也能读懂具身智能行业的未来趋势。
第一,底层技术创新,永远是硬科技的核心竞争力。当下AI行业,很多企业沉迷于应用层模式创新,不愿啃底层技术硬骨头。但影身智能证明:只有攻克底层架构、核心算法,才能建立真正的技术壁垒,获得资本和市场的长期认可。具身智能的终极竞争,不是场景比拼,而是谁能让机器人真正理解物理世界。
第二,科研与产业结合,才是技术落地的唯一捷径。纯学术团队容易陷入 “炫技陷阱”,纯产业团队缺乏技术突破能力。影身智能的 “清华天团 + 阿里老兵” 组合,告诉我们:硬科技创业,必须左手抓科研突破,右手抓产业落地,既要有仰望星空的技术理想,也要有脚踏实地的商业思维。
第三,场景为王,解决真问题才能创造真价值。具身智能不是空中楼阁,只有扎根真实场景,解决产业痛点,才能实现商业闭环。影身智能避开热门人形机器人赛道,聚焦双柔性制造,用千万级订单证明:市场永远为能解决问题的技术买单。
第四,低成本普惠,是技术规模化的关键。任何前沿技术,只有降低成本、走向普惠,才能实现大规模普及。影身智能通过影身360降低数据成本,通过模块化设计降低落地成本,推动具身智能技术平权,让中小企业也能用上先进智能方案,这才是技术的终极价值。
从成立不到两年,到连融三轮近亿;从原生3D技术突破,到千万级订单落地;从工业柔性场景,到全场景通用物理智能布局,影身智能用一年多时间,走出了一条中国硬科技创业的标杆路径。
它的崛起,不是偶然,而是技术趋势、团队基因、商业判断共同作用的结果。在AI大模型从虚拟走向实体、机器人从实验室走向世界的时代浪潮中,影身智能用原生3D动态世界模型,重新定义了具身智能的底层规则,为行业打开了物理一致、低成本泛化、规模化落地的全新可能。
未来,当机器人真正理解三维物理世界,当具身智能走进千行百业、千家万户,我们会记得:有一家中国公司,从清华实验室出发,用原创底层技术,打破二维次元壁,让机器人拥有了真正的物理认知能力。
这场关于物理世界理解的革命,才刚刚开始。而影身智能,已经站在了浪潮之巅。
往期推荐
融资10亿!上海国资重仓AMD前员工
吴夏青是谁?为什么离职英伟达创业?
点赞鼓励一下
图片来源:网络
本文不作为投资建议

