调研中我们发现,管理者真正关心的是现场是否按工序推进,而非拍到多少照片。人工巡检零散且滞后,问题常被延误放大。为此,我们尝试让Dock无人机在少量标注下识别施工工序,将航拍影像转化为可预警的进度信息。
导 读
施工现场变化快速,但进度判断仍依赖人工巡检与经验,信息零散、反馈滞后,难以及时发现风险。本文探索利用自主无人机与少样本视觉智能,实现工序级进度感知,让工地从“被拍到”走向“被看懂”,为精细化管理提供新路径。
图1 面向过程感知施工监控的对接式少样本框架
施工进度是工程管理中最关键的信息之一,但在实际现场,进度判断仍高度依赖人工巡检与经验汇报,零散且滞后,往往在问题累积后才被发现。随着项目规模和复杂度提升,这种方式越来越难以支撑精细化管理。
现有无人机和视觉技术虽提升了现场记录能力,但多数研究仍停留在构件识别层面,无法回答管理者最关心的问题——现场正在进行哪一道工序,是否按计划推进。从“看见构件”到“理解工序”之间的语义鸿沟,已成为数字化施工管理的关键瓶颈。
例如,在主体结构施工阶段,同一楼层内往往交错开展多种作业。无人机视觉系统即使能够识别楼板钢筋、柱钢筋及叠合板等构件实体,也难以仅凭构件存在性判断具体施工工序。以本文划分的阶段为例,楼板钢筋绑扎与混凝土浇筑前阶段在视觉上均表现为楼板钢筋已铺设;柱钢筋绑扎阶段中柱筋已竖立,但楼板区域仍可能保留前序工序特征;而叠合板吊装阶段中,预制构件的出现又会局部遮挡或叠加已有构件信息。由于不同工序在构件层面高度重叠,仅依赖构件识别容易混淆工序阶段,从而造成进度与现场状态判断偏差。本文指出,施工工序识别在本质上是一个小样本学习问题。施工初期可获得的标注样本极少,而现场环境和作业状态却持续变化,要求模型在极少监督下保持稳定推理能力。为此,本文将自主无人机与小样本学习相结合,提出了一种面向工序级进度监测的整体解决方案。
在数据获取层面,引入具备自动起降与充电能力的 Dock 无人机,实现施工现场影像的持续、稳定采集,使进度感知从零散记录转变为连续观测,为后续分析提供可靠基础。
在方法设计上,本文构建了一个基于共享视觉主干网络的框架,用于协同完成三项任务:位置识别、Region of Interest (ROI) 检测与工序分类。位置识别为模型提供视角与楼层先验,降低外观变化干扰;ROI 检测自动聚焦于关键作业区域,抑制背景噪声;工序分类则采用基于度量的小样本学习策略,在少量示例条件下实现稳健识别。三者协同,使模型在复杂场景中仍具备良好泛化能力。
此外,针对施工现场遮挡与局部异步作业的特点,本文引入多视角融合策略,将同一时段的多视角预测结果进行综合,进一步提升工序判断的稳定性。
该方法的价值不仅体现在识别精度上,更体现在施工管理方式的改变。通过将每日航拍影像转化为连续、可追溯的工序时间线,管理者能够更早发现进度偏差的苗头,减少沟通歧义,并为后续与数字孪生和 通过将时间维度引入三维 BIM 模型的4D BIM 计划体系的深度融合奠定基础。
总体而言,本文展示了一条从自动化采集走向智能理解施工现场的现实路径,为实现最小监督下的工序级进度感知提供了可行方案。
总结与展望
基于小样本学习的自主无人机进度监测不仅提升了施工现场的自动化感知能力,更使进度认知从依赖人工巡查的经验判断,转向基于视觉数据的工序级自动推理。通过融合自主感知与数据高效的工序推理,该方法有效应对了施工现场视觉变化大、标注稀缺和依赖人工判断等长期难题,具备良好的工程可行性与扩展性,可将连续航拍影像转化为客观、可决策的进度信息。
未来研究仍需关注跨项目泛化能力、工序过渡与时序建模问题,并进一步与数字孪生和 4D BIM 计划体系深度融合,推动施工进度监测由静态识别迈向解释性与前瞻性智能。
扫二维码 阅读原文
原文链接:https://www.the-innovation.org/article/doi/10.59717/j.xinn-inform.2026.100018
本文内容来自The Innovation 姊妹刊The Innovation Informatics第2卷第1期以Editorial发表的“Autonomous UAV systems with few-shot visual intelligence for process-aware construction monitoring” (投稿: 2025-12-17;接收: 2026-01-27;在线刊出: 2026-01-30)。
DOI:10.59717/j.xinn-inform.2026.100018
引用格式:Zou Y., Liang T., Xu Z., et al. (2026). Autonomous UAV systems with few-shot visual intelligence for process-aware construction monitoring. The Innovation Informatics 2: 100018.
作者简介
梁天翔 湖北工业大学土木建筑与环境学院研究人员,主要从事自主无人系统、计算机视觉与智能建造交叉研究,关注基于无人机的施工进度感知、工序识别及小样本学习方法,致力于将数据高效的智能感知技术应用于真实工程场景。
熊 彪 武汉理工大学计算机科学与人工智能学院副教授,硕士生导师,研究方向涵盖人工智能、计算机视觉与智能建造等领域。长期致力于智能感知与工程应用研究,在相关国际期刊与会议发表多篇高水平论文,积极推动人工智能技术在复杂工程场景中的落地应用。

