
如果说大语言模型是在互联网的文本海洋里「捞鱼」,那机器人 AI 就是在现实中一滴一滴地「采血」。前者数据取之不尽,后者每一秒都要真金白银砸出来。
这句话用来形容 Config 正在做的事,再贴切不过。2025 年刚开年,这家总部横跨首尔和硅谷的初创公司就扔下了一颗重磅炸弹——种子轮拿下 2700 万美元,估值超 2 亿。而在它身后站着的,是整个韩国制造业的半壁江山。
韩国三大财阀罕见联手,这家公司什么来头?
最近硅谷和首尔同时传出一个消息:一家名叫 Config 的初创公司完成了 2700 万美元的种子轮融资,估值直接冲过 2 亿美元。注意,是种子轮,不是 B 轮、C 轮。
更引人注目的是投资方名单。领投的是 三星创投(Samsung Venture Investment),跟投的还包括现代汽车的 ZER01NE Ventures、LG Tech Ventures、SK 电信旗下的 SKT America。 angel 投资人里还有 Pieter Abbeel——Covariant AI 的联合创始人、UC Berkeley 教授,在机器人学术圈几乎无人不晓。
财务投资方同样阵容豪华:Mirae Asset Ventures(未来资产)、韩国产业银行、GS Futures、Kakao Ventures、Z Ventures。一张名单几乎把韩国财阀和顶级 VC 扫了个遍。
值得注意的是,这种级别的财阀联动在韩国创投圈并不常见。三星、现代、LG 虽然是韩国经济的三驾马车,但彼此在投资上通常各有侧重。能让它们同时坐上一张桌子的项目,必然踩中了一个极其确定的趋势。Config 做的,正是机器人 AI 的「卖水人」生意——不亲自下场造机器人,但所有想造好机器人的公司,都离不开它。
不造机器人,只喂饱机器人的「大脑」
Config 的核心定位很有意思。公司 2025 年 1 月才成立,创始人兼 CEO Minjoon Seo 之前是 Meta 的研究员,还当过 Twelve Labs 的首席科学家。另外三位联合创始人则来自 Waymo、Google 和 Naver。
这四个人凑在一起,没有去做人形机器人、没有做机械臂硬件,而是选择了一条更底层的路:给机器人提供训练数据。
Seo 打了个精妙的比方。他说 Config 想做的是机器人领域的 TSMC(台积电)。台积电给苹果、英伟达、AMD 代工芯片,但从不和他们正面竞争。Config 也希望在机器人 AI 生态里扮演类似角色——我不做你的机器人,我让你的机器人变聪明。
这个思路背后是一个正在发生的行业趋势:越来越多的大型制造商不想把机器人 AI 全部外包给第三方,而是想构建自己的专有模型。但他们缺数据,缺高质量、海量的物理动作数据。Config 就是来填补这个空白的。
机器人数据有多贵?每一秒都是真金白银
很多人可能觉得,训练 AI 不就是「喂数据」吗?ChatGPT 不也是吃掉了整个互联网才练出来的?
但机器人 AI 完全是另一回事。
Seo 在采访中算了一笔账:大语言模型的训练确实烧钱,主要是算力贵。但原材料几乎免费——互联网上的文本、代码、论文取之不尽。你想教机器人走路、抓取、组装,却没有任何现成数据库可以下载。
每一秒训练数据都必须物理采集:你需要机器人本体、运行场地、操作人员,反复做同一个动作,录下来、标注好、清洗完,才能送进模型。更麻烦的是,不同机器人的机械结构、传感器配置、运动学参数各不相同,你在 A 机器人身上采集的数据,往往没法直接喂给 B 机器人。成本随着数据量线性上升,几乎没有规模效应可言。
这种「数据饥渴」恰恰是 Config 看到的巨大机会。
这就是为什么机器人 AI 的研发费用远超纯软件 chatbot。也正因为门槛这么高,大部分团队只能在小数据集上训练,然后祈祷模型能泛化到真实场景。
| 维度 | 大语言模型(LLM) | 机器人基础模型(RFM) |
|---|---|---|
| 数据来源 | 互联网文本、代码、书籍 | 物理世界动作采集 |
| 获取成本 | 极低(近乎免费) | 极高(需设备+场地+人力) |
| 数据规模 | 万亿级 tokens | 通常仅数千小时 |
| 可扩展性 | 指数级扩展 | 线性扩展,受物理条件限制 |
| 标注难度 | 自动化程度高 | 需要专业动作捕捉与人工校验 |
10 万小时数据,30 倍于开源标杆
Config 目前已经在首尔和越南河内建立了数据采集基地,团队接近 300 人。截至目前,他们积累的人类动作数据已经超过 10 万小时。
这个数字是什么概念?目前业内最大的开源机器人数据集 AgiBot World,规模大概是 3000 小时。Config 的数据量是它的 30 倍以上。
而且 Config 不是在办公室里摆拍。他们的数据采集分为两条线:一是在受控工作室环境中记录标准动作,二是在真实作业现场采集复杂场景。双管齐下,既有质量又有多样性。
这种规模不是小公司能轻易复制的。更重要的是,Config 的数据不是「 raw footage(原始录像)」那么简单,而是经过预处理和转换后的高质量训练素材。壁垒一旦建立,后来者很难在短时间内追赶。
核心技术:为什么「转换数据」比「转换模型」更聪明?
说到这里,你可能会问:别家也可以堆人堆时间采集数据啊,Config 的差异化到底在哪?
答案是 数据转换技术。
大多数机器人团队的做法是:先拿人类动作数据训练一个模型,再想办法把它适配到机器人身上。这听起来合理,但 Seo 认为这个思路从根本上就有问题。
他举了一个很形象的例子:用纯英语教材去教韩国人学韩语。虽然语言有共通之处,但发音系统、语法结构、文化语境完全不同。强行迁移,效率极低,错误率还高。
Config 的做法是反过来的:在训练开始之前,就把人类动作数据转换成更适合机器人的形态。不是让模型去适应数据,而是让数据去匹配模型和物理世界的需求。
Seo 的原话是:「数据必须被转换,而不是模型。这项转换技术就是 Config 的核心技术差异化。」
这句话值得细品。在 AI 领域,过去一年所有人都在卷模型架构、卷参数量,英伟达的新卡一发布就抢着买。但 Config 却选择了数据工程这个更苦、更累、但也更难被抄袭的方向。模型开源的速度越来越快,但高质量物理数据永远是稀缺资源。谁掌握了数据,谁就掌握了机器人 AI 的「氧气」。
already 赚钱,下一步要干三件大事
好消息是,Config 不是只烧钱的概念公司。COO Jack Bang 透露,公司已经产生收入,客户涵盖大型制造商、系统集成商,以及农业和国防领域的企业。
同赛道的竞争者包括 Physical Intelligence、Generalist AI 和 Skild AI。Physical Intelligence 最近也备受瞩目,但走的是模型路线;Skild AI 则背靠强大的学术资源。Config 的差异化在于,它既有亚洲本土的运营效率和人力成本优势,又有韩国制造业巨头的生态背书,这在目前的市场格局中是独一份的。
这次融到的钱将投向三个方向:
第一,数据规模再上一个量级。 把河内和首尔的数据采集能力扩到 100 万小时,进一步拉开与对手的差距。
第二,企业平台商业化。 目标是在 2027 年底前把 ARR(年度经常性收入)做到 1000 万美元。
第三,推出云端 RaaS(Robot-as-a-Service)产品。 让客户无需在本地部署硬件,直接通过云端调用 Config 的基础模型。这相当于把「卖数据」升级为「卖智能」,商业模式的天花板更高。
写在最后
Config 的故事,本质上是一场关于「基础设施」的押注。
当所有人都在关注 Figure AI、特斯拉 Optimus、波士顿动力这些明星机器人公司时,Config 选择了一条更低调、但更扎实的路:没有数据,再聪明的算法也是巧妇难为无米之炊。
韩国三大财阀的集体入场,不仅是对 Config 的认可,更是对整个「物理 AI」赛道的投票。亚洲制造业的基因——大规模生产、出口导向、供应链精细化——正在重塑下一个十年的 AI 竞争格局。
而 Config,或许就是那个藏在聚光灯之外、却掌握着关键钥匙的玩家。

