大数跨境

三星、现代、LG 集体押注!这家「机器人版台积电」凭什么值 2 亿美元?

三星、现代、LG 集体押注!这家「机器人版台积电」凭什么值 2 亿美元? 洞见畏来
2026-05-12
3
导读:如果说大语言模型是在互联网的文本海洋里「捞鱼」,那机器人 AI 就是在现实中一滴一滴地「采血」。前者数据

如果说大语言模型是在互联网的文本海洋里「捞鱼」,那机器人 AI 就是在现实中一滴一滴地「采血」。前者数据取之不尽,后者每一秒都要真金白银砸出来。

这句话用来形容 Config 正在做的事,再贴切不过。2025 年刚开年,这家总部横跨首尔和硅谷的初创公司就扔下了一颗重磅炸弹——种子轮拿下 2700 万美元,估值超 2 亿。而在它身后站着的,是整个韩国制造业的半壁江山。

               
韩国三大财阀罕见联手,这家公司什么来头?

最近硅谷和首尔同时传出一个消息:一家名叫 Config 的初创公司完成了 2700 万美元的种子轮融资,估值直接冲过 2 亿美元。注意,是种子轮,不是 B 轮、C 轮。

更引人注目的是投资方名单。领投的是 三星创投(Samsung Venture Investment),跟投的还包括现代汽车的 ZER01NE Ventures、LG Tech Ventures、SK 电信旗下的 SKT America。 angel 投资人里还有 Pieter Abbeel——Covariant AI 的联合创始人、UC Berkeley 教授,在机器人学术圈几乎无人不晓。

财务投资方同样阵容豪华:Mirae Asset Ventures(未来资产)、韩国产业银行、GS Futures、Kakao Ventures、Z Ventures。一张名单几乎把韩国财阀和顶级 VC 扫了个遍。

值得注意的是,这种级别的财阀联动在韩国创投圈并不常见。三星、现代、LG 虽然是韩国经济的三驾马车,但彼此在投资上通常各有侧重。能让它们同时坐上一张桌子的项目,必然踩中了一个极其确定的趋势。Config 做的,正是机器人 AI 的「卖水人」生意——不亲自下场造机器人,但所有想造好机器人的公司,都离不开它。

               
不造机器人,只喂饱机器人的「大脑」

Config 的核心定位很有意思。公司 2025 年 1 月才成立,创始人兼 CEO Minjoon Seo 之前是 Meta 的研究员,还当过 Twelve Labs 的首席科学家。另外三位联合创始人则来自 Waymo、Google 和 Naver。

这四个人凑在一起,没有去做人形机器人、没有做机械臂硬件,而是选择了一条更底层的路:给机器人提供训练数据

Seo 打了个精妙的比方。他说 Config 想做的是机器人领域的 TSMC(台积电)。台积电给苹果、英伟达、AMD 代工芯片,但从不和他们正面竞争。Config 也希望在机器人 AI 生态里扮演类似角色——我不做你的机器人,我让你的机器人变聪明

这个思路背后是一个正在发生的行业趋势:越来越多的大型制造商不想把机器人 AI 全部外包给第三方,而是想构建自己的专有模型。但他们缺数据,缺高质量、海量的物理动作数据。Config 就是来填补这个空白的。

               
机器人数据有多贵?每一秒都是真金白银

很多人可能觉得,训练 AI 不就是「喂数据」吗?ChatGPT 不也是吃掉了整个互联网才练出来的?

但机器人 AI 完全是另一回事。

Seo 在采访中算了一笔账:大语言模型的训练确实烧钱,主要是算力贵。但原材料几乎免费——互联网上的文本、代码、论文取之不尽。你想教机器人走路、抓取、组装,却没有任何现成数据库可以下载

每一秒训练数据都必须物理采集:你需要机器人本体、运行场地、操作人员,反复做同一个动作,录下来、标注好、清洗完,才能送进模型。更麻烦的是,不同机器人的机械结构、传感器配置、运动学参数各不相同,你在 A 机器人身上采集的数据,往往没法直接喂给 B 机器人。成本随着数据量线性上升,几乎没有规模效应可言。

这种「数据饥渴」恰恰是 Config 看到的巨大机会。

这就是为什么机器人 AI 的研发费用远超纯软件 chatbot。也正因为门槛这么高,大部分团队只能在小数据集上训练,然后祈祷模型能泛化到真实场景。

维度 大语言模型(LLM) 机器人基础模型(RFM)
数据来源 互联网文本、代码、书籍 物理世界动作采集
获取成本 极低(近乎免费) 极高(需设备+场地+人力)
数据规模 万亿级 tokens 通常仅数千小时
可扩展性 指数级扩展 线性扩展,受物理条件限制
标注难度 自动化程度高 需要专业动作捕捉与人工校验

               
10 万小时数据,30 倍于开源标杆

Config 目前已经在首尔和越南河内建立了数据采集基地,团队接近 300 人。截至目前,他们积累的人类动作数据已经超过 10 万小时

这个数字是什么概念?目前业内最大的开源机器人数据集 AgiBot World,规模大概是 3000 小时。Config 的数据量是它的 30 倍以上

而且 Config 不是在办公室里摆拍。他们的数据采集分为两条线:一是在受控工作室环境中记录标准动作,二是在真实作业现场采集复杂场景。双管齐下,既有质量又有多样性。

这种规模不是小公司能轻易复制的。更重要的是,Config 的数据不是「 raw footage(原始录像)」那么简单,而是经过预处理和转换后的高质量训练素材。壁垒一旦建立,后来者很难在短时间内追赶。

               
核心技术:为什么「转换数据」比「转换模型」更聪明?

说到这里,你可能会问:别家也可以堆人堆时间采集数据啊,Config 的差异化到底在哪?

答案是 数据转换技术

大多数机器人团队的做法是:先拿人类动作数据训练一个模型,再想办法把它适配到机器人身上。这听起来合理,但 Seo 认为这个思路从根本上就有问题。

他举了一个很形象的例子:用纯英语教材去教韩国人学韩语。虽然语言有共通之处,但发音系统、语法结构、文化语境完全不同。强行迁移,效率极低,错误率还高。

Config 的做法是反过来的:在训练开始之前,就把人类动作数据转换成更适合机器人的形态。不是让模型去适应数据,而是让数据去匹配模型和物理世界的需求。

Seo 的原话是:「数据必须被转换,而不是模型。这项转换技术就是 Config 的核心技术差异化。」

这句话值得细品。在 AI 领域,过去一年所有人都在卷模型架构、卷参数量,英伟达的新卡一发布就抢着买。但 Config 却选择了数据工程这个更苦、更累、但也更难被抄袭的方向。模型开源的速度越来越快,但高质量物理数据永远是稀缺资源。谁掌握了数据,谁就掌握了机器人 AI 的「氧气」。

               
already 赚钱,下一步要干三件大事

好消息是,Config 不是只烧钱的概念公司。COO Jack Bang 透露,公司已经产生收入,客户涵盖大型制造商、系统集成商,以及农业和国防领域的企业。

同赛道的竞争者包括 Physical Intelligence、Generalist AI 和 Skild AI。Physical Intelligence 最近也备受瞩目,但走的是模型路线;Skild AI 则背靠强大的学术资源。Config 的差异化在于,它既有亚洲本土的运营效率和人力成本优势,又有韩国制造业巨头的生态背书,这在目前的市场格局中是独一份的。

这次融到的钱将投向三个方向:

第一,数据规模再上一个量级。 把河内和首尔的数据采集能力扩到 100 万小时,进一步拉开与对手的差距。

第二,企业平台商业化。 目标是在 2027 年底前把 ARR(年度经常性收入)做到 1000 万美元

第三,推出云端 RaaS(Robot-as-a-Service)产品。 让客户无需在本地部署硬件,直接通过云端调用 Config 的基础模型。这相当于把「卖数据」升级为「卖智能」,商业模式的天花板更高。

               
写在最后

Config 的故事,本质上是一场关于「基础设施」的押注。

当所有人都在关注 Figure AI、特斯拉 Optimus、波士顿动力这些明星机器人公司时,Config 选择了一条更低调、但更扎实的路:没有数据,再聪明的算法也是巧妇难为无米之炊

韩国三大财阀的集体入场,不仅是对 Config 的认可,更是对整个「物理 AI」赛道的投票。亚洲制造业的基因——大规模生产、出口导向、供应链精细化——正在重塑下一个十年的 AI 竞争格局。

而 Config,或许就是那个藏在聚光灯之外、却掌握着关键钥匙的玩家。


【声明】内容源于网络
0
0
洞见畏来
专注于前沿科技趋势,剖析底层算法逻辑,深耕商业化场景落地
内容 633
粉丝 0
洞见畏来 专注于前沿科技趋势,剖析底层算法逻辑,深耕商业化场景落地
总阅读228
粉丝0
内容633