大数跨境
0
0

计算机视觉在文物保护智能损伤监测中的应用研究——以云冈石窟壁画为例

计算机视觉在文物保护智能损伤监测中的应用研究——以云冈石窟壁画为例 CHCD数字遗产专委会
2025-05-23
2
导读:计算机视觉在文物保护智能损伤监测中的应用研究——以云冈石窟壁画为例

计算机视觉在文物保护智能损伤监测中的应用研究——以云冈石窟壁画为例


摘要

为提高文化遗产保护中石窟壁画受害监测的精度,实现快速实时检测,本文提出了一种利用计算机视觉技术的智能监测算法,称为 YOLO CP(Cave Paintings)。C2f-FasterEMA Block 模块就是由该算法开发的,它也细化了骨干网络中深层的残差模块。这种改进提高了提取目标特征的能力,同时最大限度地减少了参数的数量。此外,RepGD (Rep Gather-and-Distribute) 机制已被集成到特征融合网络中,从而提高了跨层特征信息融合的能力,提高了模型的检测精度。最终,提出了 Inner-SIoU (Linear Spatial Intersection over Union) 以增强损失函数。这种方法利用了更合适的纵横比度量,解决了原始损失函数的缺点,从而加快了模型的收敛速度。实验结果表明,与原始的 YOLOv10n 基线算法相比,YOLO CP 算法在检测洞穴壁画损伤的任务中,参数和浮点运算分别减少了 8.14% 和 7.14%。同时,YOLO CP 模型显示 Precision 和 Recall 分别提高了 1.82 和 7.05 个百分点。实时检测速度达到 277.39 FPS。所提出的算法在性能上表现出了相当大的提升,为洞穴壁画损伤的自动化和智能检测提供了理论和技术支持。 此外,它还有望在嵌入式设备上快速实施,作为保存文物和遗产的重要技术保证。



一、研究问题

云冈石窟壁画因长期暴露于自然环境和人为活动的影响,普遍存在颜色褪变、基底开裂、颜料层脱落等损伤问题。现有检测方法主要依赖人工目视或传统图像处理技术,存在效率低、成本高、精度不足等缺陷。尤其是对于微小裂纹、初期老化迹象等细微损伤,传统方法难以在复杂背景中及时识别。

此外,现有深度学习模型(如YOLO系列)在应用于壁画损伤检测时面临模型冗余、计算量大、实时性差等问题,无法满足嵌入式设备部署的需求。因此,如何在保证检测精度的同时降低模型复杂度、提升实时性,成为文物保护领域亟待解决的核心问题。


研究区域示意图。

 


二、研究意义

文化遗产的不可再生性决定了其保护的紧迫性。云冈石窟作为佛教艺术与中西文化交流的重要见证,其壁画的损坏不仅意味着艺术价值的丧失,更可能导致历史信息的永久缺失。当前,壁画损伤的早期发现与精准评估是保护工作的关键,但传统检测手段难以应对大规模、高频率的监测需求。

本研究提出的YOLO CP算法通过优化模型结构与损失函数,显著提升了检测效率与精度,能够为文化遗产的实时监测与预防性保护提供技术支撑。

此外,该算法的轻量化设计使其能够在资源受限的嵌入式设备中部署,为偏远地区或复杂环境下的文物保护提供了可行性方案。



三、研究创新点 

1.通过将高效多尺度注意力机制(EMA)与FasterNet的Faster Block结合,增强模型对深层特征的细节捕捉能力。EMA模块通过分组处理特征图,在通道维度上保留空间结构信息,利用全局平均池化与Sigmoid激活函数实现跨空间学习,有效抑制复杂背景干扰。同时,Faster Block采用部分卷积(PConv)减少计算量与内存占用,结合反向残差结构提升特征多样性,从而在轻量化前提下优化损伤区域的定位精度。

2.在YOLOv10的颈部网络中引入全局特征聚合与分发机制(GD),通过浅层与深层特征的多尺度融合增强模型对不同尺寸损伤的检测能力。该机制包含特征对齐模块(FAM)与信息融合模块(IFM),利用平均池化或双线性插值调整特征尺寸,确保全局特征与局部特征的有效交互,显著提升复杂纹理背景下的目标识别鲁棒性。

3.针对传统IoU对边界框回归的局限性,提出基于辅助边界框的线性空间交并比损失。通过引入比例因子(ratio)动态调整辅助框尺寸,扩大高IoU样本的梯度影响范围,加速模型收敛。具体计算中,通过缩放真实框与预测框的中心坐标与尺寸,生成不同尺度的辅助框,结合交并比计算优化回归性能,尤其适用于微小裂纹的精准定位。



四、研究方法

1.数据集构建与预处理

研究团队在山西大同云冈石窟现场采集壁画图像,使用索尼a7m4相机(分辨率5472×3648像素)在固定ISO(400)、快门速度(1/250秒)与光圈(F/4)下拍摄,结合LED面板(色温5500K)与柔光罩控制光照条件,确保图像清晰度与一致性。最终筛选出1880张高质量图像,标注为“裂缝”与“脱落”两类损伤,并通过随机旋转、翻转、缩放等数据增强手段扩充样本多样性。数据集按7:1:2比例划分为训练集(1520张)、验证集(180张)与测试集(180张)。

 

2.模型架构设计

YOLO CP基于YOLOv10n的轻量化框架,通过以下模块改进:

1)特征提取网络:将原始C2f残差模块替换为C2f-FasterEMA Block。该模块在Faster Block的第二次卷积后嵌入EMA注意力机制,通过并行1×1与3×3卷积捕获多尺度空间信息,结合PConv减少计算量。BN与ReLU层的加入进一步加速特征提取,提升对细微损伤的敏感度。

YOLO CP 算法结构图。


图 1:有效的多尺度注意力模块 (EMA) 网络的结构。

 

2)颈部网络优化:采用RepGD机制实现跨层特征融合。浅层聚合(Low-GD)通过FAM对齐特征尺寸,IFM分割特征通道后注入全局信息;深层聚合(High-GD)则结合多头注意力与动态头模块,增强语义信息与定位特征的交互。

RepGD 机制的结构。


3)损失函数改进:采用Inner-SIoU替代传统IoU损失。通过调整比例因子(实验设定ratio=0.75),生成小于真实框的辅助框,缩小回归范围并增大梯度,加速高IoU样本的收敛。


Inner-SIoU 损失函数示意图。


3.实验设置与训练

实验环境配置为Windows 11系统、NVIDIA RTX 4090 GPU,采用PyTorch 2.0.1框架。训练参数包括输入图像尺寸640×640、批量大小32、学习率0.0001、SGD优化器及500轮次迭代。模型性能通过精确率(Precision)、召回率(Recall)、mAP@0.5、FPS等指标评估,并与YOLOv3n、YOLOv8n、Mamba YOLOb等主流算法对比。



五、研究结果

1.性能对比分析

YOLO CP在测试集上达到89.2%的精确率与74.4%的召回率,较基线模型YOLOv10n分别提升1.82%与7.05%。mAP@0.5为82.7%,显著优于其他对比模型(如YOLOv8n为72.4%,Mamba YOLOb为70.3%)。实时检测速度达277.39 FPS,较YOLOv10n提升13.2%,且模型参数量(2.48M)与计算量(7.8 GFLOPs)分别减少8.15%与7.69%,模型体积压缩至4.7MB(降低18.96%)。

a 是 YOLOv10n 算法的结果,ba 是 YOLO CP 算法的结果。


比较实时性能。


2.消融实验验证

逐步引入C2f-FasterEMA Block、RepGD与Inner-SIoU的消融实验表明,三者协同作用对性能提升至关重要。单独添加C2f-FasterEMA Block(Model 1)使精确率提升至88.2%,召回率提高1.2%;结合RepGD(Model 4)进一步优化至88.5%精确率与72.4%召回率;最终完整模型(YOLO CP)在mAP@0.5上达到82.7%,较基线模型提升9.8个百分点。

 

3.实际场景检测效果

可视化结果显示,YOLO CP在复杂纹理与光照干扰下表现出更强的鲁棒性。例如,对于与背景颜色相近的微小裂纹,YOLOv8n与YOLOv10n存在漏检或定位偏差,而YOLO CP通过FasterEMA Block的细节增强能力,检测置信度可达0.84,边界框定位误差降低约30%。在COCO通用数据集上的扩展实验进一步验证了算法的泛化性,mAP@0.5达45.9%,检测速度139.47 FPS,优于同类模型。

 

矩阵的行表示实际的损坏类型,列表示检测到的损坏类型。对角线元素反映了模型在识别裂缝和剥落方面的准确性。


a 第一裂隙图,b 第二裂隙和剪切图,c 第三剪切图,d 第四裂隙图




六、研究结论

本研究提出的YOLO CP算法通过模块化创新与损失函数优化,在云冈石窟壁画损伤检测任务中实现了精度、速度与轻量化的平衡。其核心贡献在于:

1.通过C2f-FasterEMA Block增强复杂背景下的特征提取能力,减少冗余参数;

2.利用RepGD机制提升多尺度特征融合效率,改善小目标检测性能;

3.基于Inner-SIoU的动态回归策略加速模型收敛,优化损伤定位精度。

4.实验证明,该算法可为文化遗产的自动化监测提供高效技术支持,并具备在嵌入式设备中部署的潜力。



七、研究展望

当前研究仍存在以下局限:

1.微小损伤检测挑战:对于微米级裂纹或轻微褪色,算法可能受图像噪声或光照变化干扰,导致漏检。未来可结合多光谱成像技术或自适应预处理方法增强特征区分度。

2.复杂环境适应性:极端光照(如强反射或阴影)可能影响检测稳定性,需进一步研究动态光照补偿算法。

3.多模态数据融合:现有研究仅基于RGB图像,未来可整合三维扫描、红外热成像等多模态数据,构建更全面的损伤评估体系。

4.长期监测与自学习:当前模型依赖静态数据集,需探索在线学习机制以实现损伤演变的动态追踪与预警。

 

【声明】

1仅用作学习研究,不作商用。图文若有侵权,请联系删除。

2以上文字内容仅为个人阅读后二次梳理的结果,并非原文。若造成理解歧义,请各位客官老爷们点击【阅读原文】,以原文观点为准。分享的原文版权归原作者所有。



图片

中国古迹遗址保护协会数字遗产专委会 | 秘书处

ICOMOS-CHINA Scientific Committee of Cultural Heritage Conservation by Digitalization | Secretariat

裴唯伊 杜寇

邮箱:peiweiyi@thid.cn ;dukou@thid.cn

电话:15010082521 18074104213

图片

【声明】内容源于网络
0
0
CHCD数字遗产专委会
中国古迹遗址保护协会数字遗产专业委员会(CHCD)是由中国古迹遗址保护协会(ICOMOS China)下设的针对文化遗产保护与数字化领域进行研究交流的学术组织
内容 349
粉丝 0
CHCD数字遗产专委会 中国古迹遗址保护协会数字遗产专业委员会(CHCD)是由中国古迹遗址保护协会(ICOMOS China)下设的针对文化遗产保护与数字化领域进行研究交流的学术组织
总阅读125
粉丝0
内容349