从OpenClaw到空中具身智能：北航推出UAVClaw，重构无人机系统边界- 大数跨境

无人机

2026-04-14

393

导读：从OpenClaw到空中具身智能：北航推出UAVClaw，重构无人机系统边界

【导读】OpenClaw展现数字世界智能体能力后，更现实的问题凸显：若任务目标超出屏幕，深入现实空间，智能体如何感知、规划并执行？

北航刘偲团队推出UAVClaw，一套围绕无人机构建的具身智能系统。它深度融合OpenClaw任务认知、MCP工具调度网络及VLA视觉语言动作闭环，将无人机从“飞控执行器”升级为指令驱动的“空中智能助手”，实现环境理解、指令响应与自主任务执行。

一、Agent走出屏幕后，三维空域的全新价值

过去两年智能体进展集中于数字环境，而现实任务带来质变：输入转为动态地图、视觉及空间关系，执行结果涉及物理世界的轨迹与动作。环境感知与具身控制成为核心挑战。

无人机凭借真三维空间自由度，可突破地形限制。UAVClaw旨在让其在巡检、侦察等场景中，摆脱“飞行工具”定位，成为理解任务的自主空中智能体。

UAVClaw通过全新架构实现自主作业，核心场景如下：

接令“检查车辆左侧，拍摄人像”后，无人机自主拆解任务，绕车抵近并精准拍摄特写。

常态化巡航中主动偏移航线完成路灯精细化检查，确认后回归原航线。

基于“拍摄北航校名石”的开放指令，无人机自主完成起飞、寻向、取景及返航全流程。

面对“依次右-左-右穿梭树木并翻滚”的指令，实时感知三维空间完成穿越与翻滚。

UAVClaw通过三层能力打通现实世界交互：

依托OpenClaw的语义解析与上下文建模，将自然语言指令拆解为可执行任务链，支撑交通监管、搜寻拍摄等复杂任务。

MCP抽象定位、视觉感知、飞控等模块为可组合接口层，形成智能体“工具箱”，供OpenClaw无缝调度。

将基础动作封装为动作原语库，涵盖起飞/降落、定向飞行等能力。VLA将语言指令转化为飞行策略，实现“穿越障碍区”等意图的精准轨迹规划。

相比地面机器人局限，UAVClaw揭示三维空域是检验空间感知与高机动执行的理想场景。

未来在工业园区或灾害救援中，操作员仅需输入“去东区检查3号输电塔，发现破损则绕飞拍摄特写”，即可交由系统自主执行。

无人机将从视觉延伸工具，进化为真正并肩作战的空中智能助手。

项目主页：https://prince687028.github.io/UAV-Claw/

文章来源：视觉语言导航

【声明】内容源于网络

无人机

各类跨境出海行业相关资讯

内容 18115

粉丝 1

无人机各类跨境出海行业相关资讯

总阅读126.2k

粉丝1

内容18.1k