大数跨境

中国具身智能历史性突破:千寻智能Spirit v1.5登顶全球榜首,具身智能“大脑”赛道首次跻身全球第一梯队

中国具身智能历史性突破:千寻智能Spirit v1.5登顶全球榜首,具身智能“大脑”赛道首次跻身全球第一梯队 具身涌现
2026-01-12
1
导读:2026年开年,全球具身智能领域传来重磅消息。中国AI公司千寻智能开源的Spirit v1.5模型在权威评测平台RoboChallenge的Table30榜单上以66.09分的成绩超越此前霸榜的美国模

从实验室炫技到工业产线实战,中国具身智能模型首次在性能与实用性双维度实现国际领先

2026年开年,全球具身智能领域传来重磅消息。中国AI公司千寻智能开源的Spirit v1.5模型在权威评测平台RoboChallenge的Table30榜单上以66.09分的成绩超越此前霸榜的美国模型Pi0.5,标志着中国在具身智能“大脑”赛道首次跻身全球第一梯队。

● 硬核登顶:真机实测下的全面超越

RoboChallenge并非普通的仿真测试平台,而是由Dexmal、Hugging Face和智源研究院等机构联合发起的全球首个大规模真机评测平台。与传统的仿真环境跑分不同,RoboChallenge的核心优势在于“真机实测”,其Table30任务集包含插花、制作三明治、插入网线等30个真实场景任务,全面考察机器人的3D定位、遮挡处理、多阶段长序列任务等核心能力。

在最新公布的榜单中,Spirit v1.5以66.09分、50.33%成功率的成绩显著超越Pi0.5的61.84分、42.67%成功率。这一成绩的含金量在于,它是基于统一硬件和真实任务的系统级评测,未依赖定制化优化。

从实际测试视频可以看出两者差距:在贴胶带任务中,Spirit v1.5控制机器人精准找到胶带并顺利完成粘贴,而Pi0.5经过多次尝试仍未能成功撕下胶带;在插花任务中,Spirit v1.5能调整关节姿态确保花束垂直插入花瓶,而Pi0.5只能将花横放在花瓶上。

Spirit v1.5堆叠彩色方块任务分为10个评价维度,成功率80%,子项总分85分

● 技术破局:从“干净数据”到“物理常识”的范式转变

Spirit v1.5的胜出并非偶然,而是源于对机器人预训练数据范式的根本性重构。

传统具身模型大多基于Open X-Embodiment等“干净数据”进行训练。这些数据如同精心导演的电影场景:物体放置在可预测位置,动作经过简化脚本化。虽然为模型提供了稳定起点,却产生了致命副作用——经验的零散孤岛。在这种数据下训练的模型,一旦面对真实世界的不可预测性,极易失效。

千寻智能采用了“开放式、目标驱动”的数据采集策略。操作员不再遵循固定脚本,而是基于高层目标(如“清理厨房”)即兴发挥。这种范式转变带来了两大突破:

构建连续的技能流形:在真实操作中,采集员可能先拿起食物容器,发现碎屑后开始擦拭,接着整理餐具。这种连续会话将抓取、扭转、插入等微技能自然串联,使模型学习到动作间的过渡与衔接,而非孤立的动作片段。

内化的纠错与恢复能力:由于训练数据包含大量现实环境中的混乱交互,Spirit v1.5习得了类似人类的“物理常识”。当面对物体打滑或光线突变时,它能进行动态调整而非直接“死机”。

千寻智能的消融实验证实了这一策略的有效性:使用多样化数据训练的模型达到相同性能所需的微调迭代次数比基线模型少40%,且随着数据规模扩大,模型在新任务上的验证误差持续下降。

多样化采集预训练的模型比干净数据采集训练的模型具有更快的收敛速度和更好的验证误差

● 工程落地:从实验室榜单到工业产线的双重验证

技术突破的价值最终需要通过实际应用来检验。Spirit v1.5的独特之处在于,它同步完成了“上限验证”与“下限验证”。

宁德时代中州基地的电池PACK生产线上,搭载Spirit v1.5的人形机器人“小墨”负责电池包下线前的终检、耐压测试等关键工序。根据官方数据,小墨在高压测试插头插接任务中成功率超过99%,作业效率较人工提升三倍,有效规避了高压安全风险。

这一案例的意义远超实验室Demo:工业产线的复杂工况对机器人的稳定性、适应性提出极致要求。99%的成功率不仅证明了模型的技术成熟度,更展现了其应对真实工业场景的工程化能力。

● 开源战略:中国AI的基础设施担当

与许多顶尖模型选择闭源不同,千寻智能宣布全面开源Spirit v1.5的基模权重、推理代码及使用样例。这一决定延续了中国AI团队在开源领域的优良传统。

回顾过去两年,从Qwen、DeepSeek到Kimi,中国大模型团队已多次证明:开源模型不仅能追平闭源性能,更能成为推动全球技术平权的重要基础设施。在具身智能领域,高性能基础模型的缺失长期制约产业发展——开发者要么使用弱模型,要么依赖大厂API且难以定制适配。

Spirit v1.5的开源填补了这一空白。对科研界,它提供了与Pi0.5同等甚至更强的可复现基线;对产业界,它为中小型厂商提供了经过验证的技术底座,避免行业性重复造轮子。

● 产业启示:双重验证打破技术泡沫

具身智能行业长期存在两类技术错配:一是算法榜单亮眼却难以落地,二是Demo演示出色却扛不住标准化评测。这种脱节催生了技术泡沫,使下游厂商选型时顾虑重重。

Spirit v1.5的突破在于同步通过RoboChallenge的标准评测与宁德时代的产线验证,建立了“能比又能用”的双重标准。这种验证体系为行业提供了可参考的实践范式,从根本上解决了技术与产业脱节的痛点。

对于机器人厂商,这意味着国产模型已具备从“备选项”升级为“主选项”的条件;对系统集成商,模型不确定性的风险显著降低,自动化方案落地进程将加速。

● 未来展望:从技术突破到产业变革

Spirit v1.5的登顶不仅是技术参数的胜利,更是技术路线的验证。它证明了中国团队在核心数据范式上已具备定义规则的能力,而非仅仅跟随。

随着代码仓库的公开,全球开发者的测试与反馈将帮助Spirit v1.5持续迭代。真正的考验在于能否在千万种真实场景中经受住打磨。

从更宏观视角看,中国具身智能产业正迎来独特机遇:完善的工业基础、强大的供应链集成能力和丰富的应用场景密度,为技术落地提供了肥沃土壤。以Spirit v1.5为代表的技术突破,正在加速具身智能从技术探索迈向规模化落地。

【声明】内容源于网络
0
0
具身涌现
具身涌现是密切关注并报道具身智能技术、智能时代产业和全链路机器人发展的科技创新平台,引领中国具身智能产业发展,推动变革式内容平台。
内容 0
粉丝 0
具身涌现 具身涌现是密切关注并报道具身智能技术、智能时代产业和全链路机器人发展的科技创新平台,引领中国具身智能产业发展,推动变革式内容平台。
总阅读0
粉丝0
内容0