“与自动驾驶相比,具身智能的技术路径更清晰、商业化落地更早,且产业链相对比较成熟。这令我们对具身智能的发展前景非常乐观。”
伴随具身智能的热潮将数据供给推向“深水区”,近日,弈人科技宣布完成PreA+轮及PreA++轮连续两轮亿元级融资,投资方分别为国方创投管理的上海市数链基金以及成都交子资本管理的自贡市人工智能基金,成为上海首家具身智能数据类的独角兽企业。
天眼查APP显示,弈人(上海)科技有限公司2019年与2025年曾相继获得来自变量资本的天使轮和来自上海的浦东资本、国家交通部旗下的交信基金Pre- A轮融资。
凭借在自动驾驶领域多年的技术沉淀与数据积累,公司在国内率先完成AI数据正向盈利,2025年AI数据业务收入过亿,打破了行业内AI数据领域“高投入、难盈利”的普遍困境,构建起可持续、可复制的盈利模式。
连续完成两轮亿级融资之际,IPO早知道近期对话弈人科技创始人马成辉,就物理AI数据的应用现状、采集难点、交付挑战以及发展前景等进行详细交流。
基于与客户的扎实、深度协同,马成辉为观察当下物理AI数据供给提供了几个特别的角度。
尽管仿真数据热度飙升,但马成辉认为,未来很长一段时间内,真实数据将仍是具身智能产业的“主角”,“如同自动驾驶阶段,真实数据量不足时可能会考虑仿真数据;但当真实数据量足够大采集足够容易的时候,需求便又回到真实数据”。
同时,在高质量数据的定义中,如何发现、采集并迅速工程化处理那些边缘场景中的“失败数据”,对于模型的训练和进化可能更为重要。而这一点仿真数据很难做到。
其中,数据的“工程处理能力”是一个隐形天花板,关系到大量数据是否能够高效稳定、低成本地被处理,并让客户高效地使用。过去几年,弈人科技已将自动驾驶领域的数据采集工具链、数据工程体系平移至具身智能场景,实现快速切入。
目前,弈人科技的海外总部已在筹划中,公司也同步在进行合规梳理,“今年和明年会是海外市场的一个爆发期,因为客户的需求已经积累到一个非常大的量级。比起价格,海外客户更注重数据质量和规模,所以我们将聚焦高质量交付,而非性价比。”
马成辉坦言,未来,弈人科技希望能够成为物理AI领域的“标杆企业”。而接下来的2-3年,将是一个比拼速度和硬实力的关键窗口期。
以下为IPO早知道与马成辉的问答精选呈现:

关注高质量数据中「失败的数据」
IPO早知道:你们是何时开始动身从自动驾驶切入具身智能领域的?
马成辉:大约在2024年底,我们一些自动驾驶的客户慢慢开始向具身智能转型。从那时开始,我们就在和一些头部客户进行相关的技术尝试。
两者技术底层相通,“感知-决策-执行”的逻辑一致,且业内一直有个共识,自动驾驶是具身智能的上半场,机器人是下半场。
在自动驾驶场景中,我们是把车当成一个移动感知器,感知道路上的信息;而具身场景中,机器人就是一个移动的智能体,需要感知封闭或者半封闭场景里的一些数据。
IPO早知道:在真实数据和合成数据方面你们是如何思考和布局的?
马成辉:目前行业对仿真数据的讨论热度的确比较高,但实际上在给客户交付的过程中我们发现,无论国内还是国际,大部分具身智能的模型公司现在的需求仍以真实数据为主。比如我们在接触的头部公司订单中,有95%以上的数据采购都是真实数据。
关于真实数据和合成数据的路线,目前大家已经形成了一些共识。首先,仿真数据能达到较高质量的前提是模型要足够好,而模型足够好的前提,又要回归高质量的真实场景数据训练。所以从第一性原理讲,如何获得高质量的真实数据才是原点。
其次,由于目前真实数据的体量不够大,一些仿真数据进来后可能会对模型产生较大影响,所以大多数公司在使用仿真数据的态度上也会比较谨慎,更多以测试为主,真正在落地场景上的训练用得反而不多。
从我们客户的反馈看,从去年开始,部分客户的要求已经不仅是数据量大,更要求数据质量高。
这其中,失败的数据也是高质量数据的一部分,而这一点在仿真数据中很难实现。以我们自动驾驶的经验看,初期真实数据量不够、采集相对困难的时候,大家会探讨用仿真数据补充,但当真实数据采集足够简单时,需求又回到了真实场景数据为主。
所以我们判断,未来很长一段时间内,具身智能产业可能仍旧会以真实数据为主,仿真数据为辅。
IPO早知道:刚才提到“失败的数据”,能否详细解释一下?
马成辉:比如物流机器人在分拣时,一个动作成功了,这是非常有价值的数据。但如果它拿一个塑料袋时失败了,这种数据对于具身智能公司也很重要。
目前在真实物理世界中执行任务时,机器人的成功率不可能达到100%,所以公司就需要分析失败的原因,然后去寻找解决方案。
另外,如何在失败场景下,让机器人迅速调整状态继续有效工作,也是让具身智能真正走进物理世界的一个重要卡点。具身智能发展到今天,失败的数据和成功的数据同样有价值。
IPO早知道:具身智能的数据采集方面,各类模态的数据占比会有差别吗?
马成辉:我们觉得具身最终还是在和真实物理世界交流,未来的终极形态上,机器人的感知会非常重要,不单是视觉,触觉,甚至包括温度、听觉等。但本质上这是一个由场景驱动的、逐步完善的过程。我们也在不断完善数据的维度。

数据处理的「工程能力」拉高竞争上限
IPO早知道:你们的星汉时空的模型几年前就已经发布,与目前大部分模型相比,它有哪些独特优势?
马成辉:首先有一点我们非常自豪,作为一个民营企业,星汉时空模型获得了上海市科技进步一等奖,并跻身国家大模型潜力Top50,等等这些奖项是学术界和产业界我们模型能力的认可。
星汉时空模型是我们自主研发的数据编辑器与认知引擎,其中有三大壁垒。一是自动化数据编译,能自动完成多模态数据(点云、轨迹、视频等)的时空对齐与语义抽取,大幅降低人工标注依赖;
二是通用时空先验知识。基于我们海量真实数据沉淀的运动与环境规律,它可以对物体如何运动、环境如何变化等相关知识进行先行验证。这一能力也让我们实现了几乎零成本从自动驾驶到具身智能场景的迁移。它像一个小脑,可以降低我们客户在新场景下的训练门槛;
三是,正向数据飞轮。我们用真实数据持续优化模型,模型提升又反哺更高质量数据采集,形成闭环。
IPO早知道:目前模型层技术仍未收敛,该模型的领先是否有“保质期”?
马成辉:过去几年,我们持续积累起百亿级的真实场景数据,这是同质化公司难以复制的壁垒。通过“场景驱动数据、数据驱动模型”的长期投入,我们形成了显著的先发优势,预计其他公司短期内难以追平。
综合来看,对真实场景的理解与高质量数据采集能力,叠加强大的数据工程能力,是我们继续保持领先的核心要素。未来,我们会继续加深这些优势壁垒,服务好自己的模型以及客户。
IPO早知道:数据工程能力在其中扮演一个什么角色?
马成辉:在构建高质量数据的过程中,数据的工程能力和数据的规模、丰富度同样重要。如何大量数据采集,并高效稳定、低成本地处理好,并让客户高效地使用,非常考验工程能力。
过去几年,我们通过在自动驾驶场景中采集的数据搭建起了自身数据工程的闭环,这也是我们能够迅速切换到具身智能场景的原因之一。
IPO早知道:就目前弈人科技已覆盖的场景看,哪些是具备更高潜力的“高价值”场景?
马成辉:在通用场景中,机器人进入家庭可能还有点远,但走进一些真实工业场景的速度会非常快。
目前,我们已经跟随客户,覆盖了仓储物流分拣、智能制造和零售等场景,这些场景都有极大潜力让机器人快速实现商业化。所以我们也正在跟一些模型本体公司一起深入挖掘相关场景数据。
IPO早知道:这些场景的数据采集难度高吗?
马成辉:还是有门槛的,第一步就是如何走到真实场景中去。几年前,国内大部分还是数采工厂的模式,但已经明显不能支撑模型的训练了。
第二,真实场景中,人一天工作大约8小时,如何在8小时里有效地采集到有价值的数据并提取出来,也是一件非常有挑战的事。相较于那些标准的、通用的动作,如何发现真实场景中有价值的数据,快速提取然后回传并实现工程化,其中需要一整套完整的数据工程方案。
这也是我们的一个核心壁垒所在。早在自动驾驶阶段,我们就已经形成了这套完善的工具链,目前已经成功平移到具身智能场景中。
其中对于数据和产业的理解非常重要。今天我们都知道模型需要大量数据,但具体需要什么样的数据,仍旧是一个挑战。比如智驾场景中,正常行驶的数据对于模型训练已经价值不大了,真正有价值的是那些边缘场景中的数据。而如何将这些边缘数据快速完成闭环,以标准化的方式回流到模型中,这些能力愈发重要。

具身智能Q1订单收入破亿,接近去年全年营收
IPO早知道:2025年公司总营收约多少,和同行相比如何?
马成辉:2025年公司AI数据总营收过亿元,并率先完成了正向盈利,是国内AI数据企业的绝对头部。当然这里面我们没有算劳动密集型的数据标注企业,在去年年底我们公司只有30多个人,90%都是技术研发人员,我们内部一直有个说法就是“用AI来处理数据”。
IPO早知道:从整体营收看,目前自动驾驶和具身智能板块的占比和增速分别是什么状态?
马成辉:去年,AI数据的整体收入已经过亿,其中自动驾驶板块收入占比超60%。但今年一季度,我们接到的具身智能相关订单就已经突破了1亿元,占比突破一半,已反超自动驾驶,成为增长主力。
IPO早知道:也就是说,今年Q1订单量对应的营收已经基本接近去年全年的营收水平。
马成辉:是的。接下来对我们比较大的挑战就是要高效地、高质量完成交付。
IPO早知道:预计具身智能板块未来几年的增速如何?
马成辉:会非常快。过去几年,我们的AI数据业务年复合增长率已经是倍数增长。像去年年底我们具身数据收入还不多,但是今年一季度已经过亿,预计这两年更会出现一个爆发性的增长,很令人期待。
IPO早知道:目前已有的客户画像大约是怎样的?
马成辉:基本分成几大类。第一类是国内科技巨头,比如阿里、百度、腾讯、字节等科技巨头;第二类是一些国内顶尖的自动驾驶公司和主机厂。第三类就是具身智能领域,目前国内一些头部的物理AI公司都已经与我们有了一些合作。
IPO早知道:头部客户的购买粘性如何?
马成辉:整体而言,科技巨头客户的延续性和复购率都比较好,我们很自豪的说头部客户的复购率几乎是100%,客户的订单是对公司的技术,产品及交付能力最好的证明。
IPO早知道:目前在交付方面还有哪些挑战?
马成辉:针对科技巨头和自动驾驶客户,我们已经实现规模化、自动化交付;但在具身智能领域,因数据标准尚未统一,仍需按项目定制交付。
目前我们也在联合头部客户推动行业标准建设,以期大幅度降低数据成本,减轻数据工程化压力。
IPO早知道:在面对客户时,是否有一些比较典型案例能够作证你们的交付能力?
马成辉:早期我们曾经合作过国内一个特别头部的企业,彼时只有一个十几万的poc订单。合作几年下来最近最新订单金额增至2000万元。今天的环境下,拿到真实的客户的订单,可能要比写几页PPT,做个产品发布会更有说服力。
这背后体现了我们几大核心能力,包括产品与技术的可靠性、项目交付能力、商业闭环思维以及客户共研能力。我们会深入客户业务场景,与客户共同定义数据标准与采集目标,成为其AI研发的“合作伙伴”而非“供应商”。

「数据、场景、工程化能力」是最大壁垒
IPO早知道:此次获得的两轮融资是如何规划使用的?
马成辉:本质上,我们是一家技术驱动型的公司,在融资的规划使用上,约60%将用于研发投入,约20%将用于引进人才。另外20%我们会和国内的一些头部的高校和场景方,共建数据闭环实验室,从场景中采集更多、更高质量的数据。
IPO早知道:目前研发投入情况如何?
马成辉:2025年,公司研发投入占营收比超过50%。2026年,随着具身业务板块的加速落地,研发投入占比预计将进一步提升。现阶段研发投入主要围绕“物理AI数据”这一核心方向展开,重点聚焦三大领域。
一是具身数据基础设施与工程能力建设,包括采购多种类型的数采设备,搭建规模化、标准化的数据采集与测试平台;二是关键人才梯队扩张。重点引进具身智能、仿真与真实数据对齐、自动驾驶场景理解等方向的高端研发人才,强化算法与工程团队的协同能力。
三是垂直场景数据源拓展。面向具身、自动驾驶等核心行业,深入挖掘长尾场景、边缘案例及高价值真实场景数据,丰富数据资产的规模与多样性,形成更强的场景壁垒。
IPO早知道:目前公司已经在国内率先实现了“AI数据的正向盈利”,这是一个什么概念?
马成辉:截至目前,我们已连续三年保持净利润为正。公司的核心目标是不断完成并验证商业闭环,而非融资后烧钱做没有回报的事,也不会过度投入市场宣传。
所以面对目前的融资热潮,我们认为还是要找到商业闭环这个根本所在。弈人科技只专注于AI数据,市面上一些边缘的业务比如卖服务器等,这种订单我们是不接的,专心把核心业务做好。
IPO早知道:在这个前提下,你们对接下来的融资节奏是如何考虑的?
马成辉:完成这两轮融资后,下半年我们更多会找一些资源方和场景方,进行场景的深挖和耕耘。这些助力对我们而言可能远要比获得资金更重要。
IPO早知道:能否具体讲讲“可持续可复制”是怎样一个盈利模式?
马成辉:本质上,这种盈利既能长期稳定(不依赖短期补贴或单一客户),又能在不同场景或市场中复制推广(例如标准化产品、模块化服务)。如今,数据资产要比实际资产更好,因为可以发挥乘数效应,可以服务更多客户。而前几年,那种A公司只能买A公司本体数据的服务,并没有发挥出数据的真实价值。
所以在具身场景中,我们一直在走技术路线,通过模型泛化能力,探索“一份数据给到更多厂商使用”的路径,这也是我们一个很重要的业务突破。
此外,我们更加关注具身Ego数据采集及应用,即第一人称的视觉数据采集,同时进行这类数据的泛化,提供给不同的客户。
IPO早知道:如果总结目前为止弈人科技的商业护城河,大概有哪些关键词?
马成辉:数据、场景和工程化三位一体,这是我们最大的壁垒,也是我们在给客户进行真实交付的过程中,逐渐沉淀下来的能力。
比如工程化层面,怎么把数据处理成客户直接可用的格式,怎么配合客户的算法接口或训练流程,怎么解决交付过程中各种现实问题(比如数据格式兼容、标注规范、传输效率等),也是一项关键的know-how能力。

出海将聚焦高质量交付,而非「性价比」
IPO早知道:面对当下的出海热潮,弈人科技是否有一些相应的行动和规划?
马成辉:出海是我们一个很重要的战略方向,从去年下半年公司就已经开始布局,目前也正在构建海外运营总部。
另外,我们现在也在跟一些国际头部物理AI公司进行项目试点。预计今年和明年海外市场会达到爆发期,因为海外客户的潜在需求已经逐渐积累到了一个巨大的量级。
IPO早知道:数据出境面临的挑战可能更多,你们会如何应对?
马成辉:一方面,海外需求量非常大,特别欧美国家,因为数据采集成本很高,而且场景不够丰富,数据能力跟不上模型发展,所以就需要大量采集。目前他们主要采用东南亚、印度的数据,如果中国能够加入,前景会非常好。
另一方面,数据出海最重要的就是合规。我们也在跟国内相关政府(如上海临港)及海外相关监管机构沟通法规落地路径。如果法律法规层面有明确的落地方案,数据出海的市场空间将非常大。
IPO早知道:海外客户的需求更多是数据还是采集的能力?
马成辉:大部分客户会希望我们把采集的高质量数据进行工程化处理之后直接交付给他们。中国的工业场景丰富度全球领先,这些数据对海外客户的模型训练非常有价值。
IPO早知道:面对海外市场,你们会更希望打“性价比”的标签吗?
马成辉:实际上,海外客户尤其是一些头部客户,在数据购买方面的对价格并不太敏感,反而更关注交付的数据规模和质量。所以在策略上,我们也会更多聚焦高质量数据的交付,而不是强调性价比。
IPO早知道:如果要出海,会优先考虑哪些国家和地区?
马成辉:首先会是欧美,同时我们也在积极接触一些日韩和东南亚客户,其中有很多场景落地的需求。

未来2-3年是关键期,期待成为「中国首家物理AI数据领域上市企业」
IPO早知道:成立以来,弈人科技也曾经历过自动驾驶的繁荣期。与当时相比,当下的具身智能热潮有哪些不同之处?
马成辉:与自动驾驶相比,我们对具身智能有这样几个感触和观察。
首先,具身智能的技术路径更清晰。在自动驾驶早期,核心技术都不太成熟,很多公司更多是在赌不同的技术路线;而具身领域的VLA、世界模型等主流路径已趋于共识。
所以无论产业方还是投资方都会形成共识。现在大家更多拼的是谁速度更快、谁场景会更多。
其次,商业化的落地更早。自动驾驶阶段很多公司烧了很多年钱,一直没有盈利,但具身智能领域目前一些跟场景关联度比较高的公司已经开始完成了商业闭环,并实现了盈利。我们就是其中之一。
而且整个氛围上,大家在具身领域也会更关心场景落地和商业化,这是和自动驾驶时代的另一个很大区别。
第三,产业链相对比较成熟。比如我们这类数据公司,可以将沉淀的经验和技术进行平移和复用,还有一些传感器、硬件等公司,能力也可复用加速。这让我们对具身的发展前景非常乐观。
IPO早知道:就目前的进展看,物理AI数据领域是否也有自己的“窗口期”?
马成辉:目前是一个向商业化过渡的关键阶段。我们预计未来1-2年是一个关键期,慢慢会形成马太效应,客户优势、资本技术可能会逐渐集中。所以如何在未来2-3年快速跑出来会非常重要。
IPO早知道:作为经历过一个周期的创业公司,弈人科技目前是否有对标的公司?
马成辉:如果一定要对标,我们可能会更倾向于Scale AI,主要做AI数据的基础设施。但在路径上,相较于Scale AI被并购,我们则希望走独立的资本化市场路线。
从产业机会和公司发展看,我们希望能成为中国首家物理AI数据领域的上市企业,成为物理AI时代的一个标杆企业,目前看来机会很大。
机器人/具身智能:灵心巧手丨飞捷科思丨森越成行丨神源生智能丨源升智能丨玄创机器人丨纬尔科技丨沐秦智能丨炎凌嘉业丨矩侨工业丨霞智科技丨微埃智能丨海桓丨松延动力丨基元智航丨

