跟随型移动机器人关键技术与挑战综述 | 特别策划：智能机器人- 大数跨境

首页

跟随型移动机器人关键技术与挑战综述 | 特别策划：智能机器人

智能制造IMS

2025-08-22

725

张思龙^1,2，姚瀚晨²，苏泽凡²，李毅焘²，林思超²

1. 福州大学电气工程与自动化学院

2. 中国科学院福建物质结构研究所

摘要：跟随机器人作为服务机器人的重要分支，在工厂巡检、物流搬运等场景中展现出广泛应用前景。本文系统综述其关键技术研究进展，涵盖感知、控制、SLAM及路径规划四大核心模块。在感知方面，分析激光雷达、视觉与UWB等多传感器融合方法的适用性与局限；控制方面，梳理阻抗控制、导纳控制、最优控制与深度强化学习策略的鲁棒性与交互性平衡；定位建图方面，比较激光/视觉SLAM与无线定位的集成方案；路径规划方面，探讨优化算法与启发式搜索在动态环境中的应用效果。文章归纳了当前面临的主要挑战，包括环境干扰下的精度下降、目标快速运动导致响应滞后、长时跟随误差累积及人机交互自然度不足，并总结代表性应对策略。未来研究应聚焦于提升多模态感知鲁棒性、实现智能化人机交互、构建自主能耗管理机制及多机器人协同体系。

关键词：跟随机器人；人机交互；多传感器融合；人机共融

引言

近年来，机器人自主跟随技术在具身智能与人机共融领域取得显著进展。跟随机器人通过感知并跟踪移动目标，实现精准随动，广泛应用于物流搬运、户外巡检等场景。为提升定位与感知能力，多种技术被提出，如超宽带（UWB）、激光SLAM、机器视觉和红外阵列等传感器方案，结合深度学习算法增强路径规划与决策能力。同时，多样化系统架构支持特定场景定制化部署。然而，系统仍面临鲁棒性不足、复杂环境导航精度下降、多机协同困难等挑战。本文综述国内外研究成果，重点分析关键技术进展，探讨核心问题与未来方向。

图1 跟随机器人实际应用场景

目前，国内外已在跟随机器人系统设计方面开展大量研究，涵盖目标跟踪传感、移动平台结构、通信与控制策略等。系统架构上，基于SDSTWR的UWB室内定位系统已用于实现自主随动[2]。2021年，研究分别通过摄像头驱动麦克纳姆轮实现全向人员跟随[3]，以及利用图像识别实现多机协同[4]。2022年，改进工作包括基于环形红外阵列的360°近场定位、低功耗ROS平台的多任务机器人，以及AprilTag标签识别系统[5–7]。武泱光等人融合激光雷达、麦克纳姆轮逆运动学与UWB通信，开发出高精度全向跟随避障系统[8]。这些研究普遍采用无线通信与自动控制技术，使用UWB、摄像头或激光雷达进行目标追踪，在算法、硬件与应用场景上各具特色，致力于提升跟随精度、响应效率与适应性。

在人机交互性能方面，深度学习与传感融合被广泛用于提升跟随效果。Li等人调研发现，跟随机器人对老年人独立生活具有社会支持潜力，但仍需优化以满足实际需求[9]；Jiang等人提出先预测2D轨迹再估计3D轨迹的方法，提升了长距离跟踪的鲁棒性[10]；Su等人采用LQR伴随控制策略，实验证明可显著减少距离与方向误差[11]。总体来看，现有研究通过深度视觉跟踪、鲁棒控制、多传感器融合与强化学习等手段提升交互质量与稳定性，但在复杂真实环境中仍需更强的自适应能力与鲁棒性。

跟随机器人关键技术

跟随机器人通常由感知、控制、定位建图与路径规划等子系统协同构成，各模块联动实现环境感知、自主决策与高效执行。典型系统架构如图2所示：感知系统获取目标与环境信息，定位建图提供空间位置支持，路径规划生成合理运动路径，控制系统驱动机器人运动并与人类交互协同。

图2 跟随机器人的关键技术框图

感知技术

跟随机器人需实时感知障碍物与目标信息，多传感器融合成为主流方案。常用传感器包括激光雷达（2D/3D）、单/双目视觉、RGB-D相机、超声波与红外阵列，用于获取距离、图像与深度数据。目标检测与跟踪算法从传统特征提取向深度学习演进，涵盖颜色直方图、形状纹理匹配及CNN目标检测方法。Priyandoko等人集成Kinect与Hokuyo激光雷达，提出面部、腿部、颜色与聚类多模式跟踪策略，实现ROS框架下的综合跟踪能力[12]。Zhu等人结合云台单目摄像头、孪生网络与光流算法，提升视觉跟随灵活性[13]。Tsai等人融合立体视觉与颜色直方图，在多变环境下稳定定位目标[14]。Lai等人提出轻量级深度学习架构，融合深度图像与雷达点云，通过自适应加权与时序建模提升导航表现[15]。2024年，Huang等人将KCF与YOLO结合，利用双目视觉恢复果园机器人目标位置，实现干扰环境下的稳定跟踪[16]。Akabane等人则利用UWB技术，对光照变化与遮挡更具鲁棒性[17]。相关研究对比见表1。

表1 机器人感知技术研究现状

研究表明：激光雷达与深度相机提供高精度距离信息，利于建模与避障；视觉传感器富含外观特征，适合细粒度识别；UWB在视觉受限场景下表现出强鲁棒性。多模态融合虽能提升准确性，但也增加系统复杂性与成本。如何在保障鲁棒性的同时控制复杂度，是感知技术发展的关键方向。

控制器技术

有效控制策略是实现目标跟踪与人机交互的核心。常用方法包括阻抗控制[20]、弹簧模型[21]、导纳控制[22]、最优控制[23]与强化学习[24]。阻抗控制通过虚拟弹簧阻尼模型赋予机器人柔顺性；导纳控制将外部力映射为期望位姿，强调交互响应；弹簧模型通过虚拟力场实现闭环相对控制。Herrera等人提出基于阻抗控制的领导-跟随方法，在Pioneer3AT机器人上实现结构化场景稳定跟随[20]。LQR等线性最优控制可有效约束距离与方向误差[23]。近年，深度强化学习被用于学习复杂行为：赵恩铭等人利用智能体训练机器人在人群中跟随，显著改善交互体验[24]。此外，MPC与阻抗控制结合也被提出，外环MPC确保姿态精确，内环阻抗维持舒适交互距离[25]。代表性策略对比见表2。

表2 机器人控制技术研究现状

分析表明：经典方法如阻抗/导纳控制可实现舒适交互，但依赖动力学假设；优化控制保证精度但需精确模型；深度学习适应复杂场景且可学习人类偏好，但训练量大且缺乏可解释性。未来趋势在于融合经典框架与学习算法，兼顾稳定性、鲁棒性与自然交互。

定位与建图技术

SLAM技术是机器人自主导航的基础。跟随机器人需准确估计自身与目标相对位置，并构建环境地图以实现安全跟随与避障。主要方法包括激光SLAM、视觉SLAM及无线信号/标记定位。激光SLAM通过扫描生成2D地图，适用于低纹理环境[26]；视觉SLAM利用特征点恢复位姿与3D地图，灵活性高[27]；多传感器融合进一步提升精度与鲁棒性。Wang等人提出激光-IMU-GNSS紧耦合SLAM系统，具备GNSS丢失容错能力，适用于矿区等信号弱环境[28]。Lv等人基于连续时间固定滞后平滑，融合LiDAR、IMU与相机数据，实现高精度实时轨迹估计[29]。各类方法各有局限：激光SLAM在无特征区域性能下降，视觉SLAM对光照敏感。因此，根据应用场景选择合适方案并融合多源信息，是提升定位可靠性的关键。代表性方法对比见表3。

表3 机器人定位与建图技术研究现状

组合使用可提升整体性能，如LiDAR与相机SLAM结合兼顾结构与纹理信息，激光SLAM与IMU/GNSS互补增强室内外切换鲁棒性。有效的定位建图方案应基于场景需求合理选型并融合多源信息，确保精确导航与动态避障。

路径规划技术

跟随过程中，机器人需实时规划路径以避障并保持与目标相对位置。传统与优化算法均被广泛应用[30]。魏博等人改进蝴蝶优化算法（BOA），引入帐篷映射与遗传因子加速全局搜索[31]。梁凯等人将改进白鲸优化算法（IBWO）与TEB局部优化结合，实现全局最优与路径平滑融合[32]。采样算法方面，APF-RRT通过动态偏置与贝塞尔曲线提升路径质量[33]。黄昱航等人将双向搜索引入A*算法，结合DWA改进启发函数，实现全局避障与路径优化[34]。李炯逸等人提出改进双向A*算法，提升室内环境搜索效率与路径质量[35]。代表性算法特征见表4。

表4 机器人路径规划技术研究现状

可见，各类优化与搜索策略均能增强复杂环境下的路径规划能力：全局优化避免局部最优，融合动态窗口法提升避障保障。但计算量大、参数调试难等问题影响实时性与稳定性。实际应用中需结合场景动态选择或简化算法，以满足实时跟随需求。

跟随机器人关键挑战

随着跟随机器人在现实场景中的广泛应用，其运行环境日益复杂，面临一系列关键技术瓶颈。真实场景中常伴随频繁扰动、剧烈目标行为变化、长时间任务与多样人机交互，对机器人能力提出更高要求。尽管现有研究在感知精度、响应速度、导航鲁棒性与交互自然度方面取得进展，但仍存在诸多挑战亟待解决。

本文归纳四类关键挑战，如图3所示：环境干扰影响感知精度、目标快速运动引发响应滞后、长时跟随导致误差累积、人机交互缺乏自然感。这些问题直接影响跟随稳定性与用户体验，也对系统设计与控制策略提出新要求。具体表现、挑战与典型对策见表5。

图3 跟随机器人的关键挑战

表5 跟随机器人的关键挑战

跟随精度受环境干扰的应对方法

复杂环境中，光照变化、背景杂乱、目标遮挡与尺度变化等因素易导致检测与跟踪精度下降甚至目标丢失。例如在商场或机场，灯光切换、人群密集与短暂遮挡可能使视觉系统失效。根本原因在于视觉算法对目标外观依赖性强，超出鲁棒范围的噪声易引发误检或漏检。为此，多源信息融合与深度学习方法受到重视。Ye等人利用人体关键点检测与滤波预测，在遮挡时仍能推断目标位置[37]。Cao等人提出多模板更新跟踪算法，通过在线收集正负样本提升区分能力，增强对动态背景与光照变化的鲁棒性[38]。结合重识别技术可降低相似行人干扰，提升复杂环境下的跟踪稳定性。

目标快速移动与剧烈场景变化下的算法响应优化

目标突然加速或环境剧变对机器人实时响应能力构成挑战。高速运动易造成运动模糊或视野偏离，导致跟丢或滞后。其机制在于：目标运动压缩了“感知-计算-执行”周期，若处理频率不足则产生延迟累积。解决思路包括引入卡尔曼滤波等预测模型，在检测间隙估计目标状态，缓解延迟[39]；采用轻量级跟踪网络，融合目标检测、ReID特征与多帧注意力预测，提升实时性能[40]；或采用“慢检测+快追踪”架构，利用神经网络高精度检测并行光学流高速追踪，实现平滑实时控制[41]。上述策略有助于机器人在剧烈变化下保持及时响应，避免明显滞后。

长距离长时间跟随中的误差累积与疲劳问题对策

在仓储巡逻、户外导引等长时任务中，机器人面临定位误差累积、目标长时间消失、能耗与机械负荷增加等问题。传感器漂移随里程增长放大，导致定位失准；目标因遮挡或转弯长时间脱离视野，可能无法重新捕获；持续运行还带来电池耗尽、电机过热等硬件风险。针对此，研究引入轨迹预测与再识别机制：根据历史轨迹预测目标行进方向，主动绕角恢复跟踪[42]；集成重识别技术，使机器人在人群混杂中仍能准确识别原目标。能源管理方面，通过多目标决策安排自主充电时机，在不中断任务前提下延长续航[43]。优化运动控制曲线，减少急启急停，既降低硬件损耗又提升跟随平稳性[44]。

人机交互中的社交空间、安全性与自然度

机器人不仅需完成跟踪任务，还需遵循社交规范，保持安全距离与自然行为。过近易侵入私人空间，过远则增加丢失风险。传统控制多关注避障与路径最优，忽视人类心理舒适度。为此，研究建立符合社交空间的距离模型，结合行人速度动态调整跟随距离，确保目标居中且距离适宜[45]。安全性方面，融合避障策略与社会力模型，使机器人能礼让行人、合理绕行[46]。自然交互方面，增加手势识别与语音反馈功能，实现直观指令响应与确认交互[47]。实证表明，经社交建模与自然交互设计的机器人在主观测评中获得更高接受度，更易融入有人环境。

总结与展望

跟随机器人作为具身智能的重要分支，涉及感知、控制、建图与规划等核心技术。本文系统综述最新进展，对比典型方案，总结优势与局限。研究趋势显示：感知向多传感器融合与深度学习发展；控制需融合学习算法提升鲁棒性；定位建图趋向激光与视觉SLAM融合；路径规划倾向混合优化与搜索方法以平衡全局最优与实时性。当前仍需解决复杂环境下长期稳定跟随、提升人机交互自然度与系统可靠性等难题。

未来研究可聚焦以下方向：①优化多变环境中跟踪算法的精度与延迟；②通过行为识别与情感理解增强社交交互能力；③探索基于5G/物联网的多机器人协同或云端远程控制；④提升硬件耐用性并降低成本以推动普及。随着具身智能发展，跟随机器人将向更高智能化、高效化与实用化迈进，为生产生活提供有力支撑。

编辑：高洁

责编：段少敏

审核：李国庆

来源：《智能制造》2025年第4期