>

NIPS 2025 | 前沿：SAFE 融合保形预测，实现 VLA 故障检测准确率与时效性最优平衡

>

0

0



NIPS 2025 | 前沿：SAFE 融合保形预测，实现 VLA 故障检测准确率与时效性最优平衡

NIPS 2025 | 前沿：SAFE 融合保形预测，实现 VLA 故障检测准确率与时效性最优平衡

Hello World Model

2025-12-07

0

导读：点击下方名片，获取你的下一个灵感实例。在机器人操作领域，视觉-语言-动作（VLA）模型正展现出令人瞩目的潜力。

点击下方名片，获取你的下一个灵感实例。

在机器人操作领域，视觉-语言-动作（VLA）模型正展现出令人瞩目的潜力。它们能遵循自然语言指令，完成从拾取物品到组装零件的多样化任务。然而，当面对未训练过的新任务时，这些模型的成功率会骤降至30%-60%，这成为其在真实世界安全部署的重大障碍。

近期发表于NIPS 2025的论文《SAFE: Multitask Failure Detection for Vision-Language-Action Models》提出了一种革命性的解决方案。该研究首次系统性定义了VLA模型的多任务故障检测问题，并设计出轻量级检测器SAFE，实现了在未见过的任务和环境中的零样本泛化能力。

论文信息

题目： SAFE: Multitask Failure Detection for Vision-Language-Action Models

SAFE：面向视觉-语言-动作模型的多任务故障检测方法**

作者： Qiao Gu, Yuanliang Ju, Shengxiang Sun, Igor Gilitschenski, Haruki Nishimura, Masha Itkina, Florian Shkurti

源码：https://vla-safe.github.io/

一、核心发现：VLA模型藏着"故障密码"

研究团队通过深入分析OpenVLA、π0等主流VLA模型的内部特征空间，有了惊人发现：成功与失败的任务执行轨迹在特征空间中呈现显著分离，且这种"故障区域"在不同任务间具有高度一致性。

VLA特征空间可视化

上图清晰展示了π0-FAST模型在LIBERO-10基准测试中的特征分布：

图(a)显示失败轨迹的特征在空间中聚集形成明显的"故障区"
图(b)验证了不同任务的故障特征会落入同一区域
图(c)动态展示了失败轨迹从正常区域逐渐滑向故障区的过程

这一发现揭示了VLA模型内部特征蕴含着跨任务通用的成败判断知识，为构建通用故障检测器奠定了理论基础。

二、SAFE方法：轻量级且泛化能力强的故障检测器

基于上述洞察，研究团队设计了SAFE（Scalable Failure Estimation）方法，其核心架构如图所示：

SAFE方法总体结构

SAFE的工作流程包含三个关键步骤：

特征提取：从VLA模型最后一层隐藏状态中提取内部特征，这些特征在解码为动作指令前包含最丰富的任务执行信息。
故障分数预测：采用两种轻量级网络架构计算故障分数：

MLP架构：独立处理每个时间步的特征，通过sigmoid函数累加生成分数
LSTM架构：时序处理特征流，动态捕捉任务执行过程中的状态变化

自适应阈值校准：利用函数型共形预测（Conformal Prediction）构建时变阈值，在保证统计可靠性的同时，将误报率控制在用户指定的范围内。

这种设计使SAFE仅需不到VLA模型1%的推理时间，就能实时输出故障概率，完美适配真实世界机器人的实时控制需求。

三、全面评估：跨平台验证卓越性能

研究团队在四种不同场景下对SAFE进行了严格测试，涵盖仿真与真实世界环境：

实验平台展示

LIBERO仿真环境：包含10个复杂操作任务，测试OpenVLA、π0和π0-FAST三种模型
SimplerEnv高保真仿真：复现真实世界操作场景，评估预训练π0模型
真实Franka机器人：13个日常任务，验证在实体机器人上的表现
真实WidowX机械臂：8个抓取任务，测试OpenVLA的故障检测能力

与12种基线方法（包括LLM不确定性量化方法、嵌入距离方法等）的对比显示：

性能对比结果

SAFE在ROC-AUC指标上全面领先，尤其在未见过的任务上优势明显
平衡准确率（Bal-Acc）平均提升15%-20%
平均检测时间（T-det）更短，能在故障发生早期及时预警
在真实世界场景中表现稳定，泛化能力显著优于现有方法

四、意义与展望

SAFE方法的提出为VLA模型的安全部署开辟了新路径。其创新点在于：

首次定义多任务故障检测问题，突破单任务局限
揭示VLA内部特征的通用故障模式，为特征探测提供理论依据
结合轻量级网络与共形预测，实现高效且可靠的故障检测

未来，该技术可直接应用于家庭服务机器人、工业协作机器人等领域，通过实时故障检测避免事故发生。研究团队已开源项目代码（https://vla-safe.github.io/），并计划进一步拓展至更多机器人平台和任务类型。

随着VLA模型能力的不断提升，SAFE这类安全机制将成为连接实验室研究与真实世界应用的关键桥梁，推动机器人操作技术迈向更安全、更可靠的新阶段。

【声明】内容源于网络

0

0

Hello World Model

欢迎关注。分享大模型相关论文，学习心得。

内容 15

粉丝 0

Hello World Model 欢迎关注。分享大模型相关论文，学习心得。

总阅读6

粉丝0

内容15