RS DL
题目:UnravelNet: A backbone for enhanced multi-scale and low-quality feature extraction in remote sensing object detection
期刊:ISPRS Journal of Photogrammetry and Remote Sensing
论文:https://doi.org/10.1016/j.isprsjprs.2025.11.002
代码:https://github.com/lwCVer/UnravelNet
原作者审阅认证
创新点
非扩展性多分支注意力机制:通过通道分割而非扩展,设计PA、LA、SMRA三种注意力模块,在不增加参数和计算量的前提下高效提取点级、局部和中程多尺度特征。
低质量特征增强模块(LFEA):针对遥感图像模糊和低质量特征问题,在浅层使用Scharr边缘检测,深层采用高斯分布建模不确定性,显著提升退化特征的表示能力。
解耦式特征提取策略:通过将输入特征沿通道维度均分为四个独立分支,利用特征冗余性实现参数高效的多尺度和低质量特征并行建模。
参数效率与精度平衡:UnravelNet-S以14.0M参数(ResNet-50的60%)在DOTA-v1.0上达到79.99% mAP的SOTA性能,特别在小目标(SP: +6.94%)和低质量目标(HC: +10.88%)类别上取得显著提升。
背景
遥感目标检测(RSOD)面临两大核心挑战:单张图像中目标尺度变化极大(从小车辆到大型机场)以及由于卫星成像限制导致的低质量特征(模糊、边缘不清)。
现有方法如LSKNet采用大核卷积捕获多尺度信息,但分辨率粗糙难以提取细节特征且对小目标效率低;PKINet使用多尺度卷积核处理不同尺度目标,但在低质量或模糊目标上提取效果不佳。这些方法的根本问题在于未能同时有效解决多尺度特征提取与低质量特征增强,且在捕获全局信息时牺牲了细节和边缘信息。因此,本文提出UnravelNet,通过非扩展性多分支注意力机制将不同尺度特征提取解耦(点、局部、中程注意力),并结合边缘信息和高斯分布专门增强低质量特征,在有限参数下实现高效、精准的遥感目标检测。
数据
遥感目标检测(RSOD)数据集
DOTA-v1.0
2,806张图像,188,282个实例,15个类别
分辨率:800×800至4000×4000像素
划分:训练集1,411张,验证集458张,测试集937张
DOTA-v1.5
与v1.0图像数量相同,但新增容器起重机(CC)类别
403,318个实例(包含小于10像素的微小实例),16个类别
DIOR-R
23,463张图像,192,518个实例,20个类别
训练+验证集:11,725张,测试集:11,738张
图像分辨率:800×800像素
FAIR1M-v1.0
超过40,000张图像,100万+实例,37个细粒度类别
训练集:16,488张,测试集:8,137张
自然图像数据集
COCO 2017
用于验证模型的跨域泛化能力
在Mask R-CNN框架下测试
方法
整体架构
四阶段设计网络包含4个阶段,下采样率为1/4、1/8、1/16、1/32
由Stem层(4×4卷积初始下采样)、DRFD下采样模块、Unravel Block组成
四阶段输出特征送入检测器完成目标检测
Unravel Block
核心模块,包含Unravel模块、两个1×1卷积、归一化层和残差连接
Unravel模块是创新核心,实现多分支特征提取
多分支注意力机制(核心创新)
设计思想
将输入特征沿通道维度均分为4个独立分支
每个分支处理不同尺度或质量的特征,最后拼接融合
通过通道分割而非扩展,实现参数高效
1. 点注意力(PA)
目标:提取极小和精细特征
方法:通过两个1×1卷积和Sigmoid生成注意力图,增强小目标特征
适用:小车辆等微小目标检测
2. 局部注意力(LA)
目标:捕获局部邻域上下文
方法:使用标准3×3卷积提取局部特征
适用:网球场、棒球场等规则形状目标
3. 稀疏中程注意力(SMRA)
目标:捕获中等范围的结构信息
方法:
先最大池化下采样扩大感受野
采用水平、垂直、对角线四个方向的直线注意力
在距离L=11范围内聚合特征并学习权重
插值恢复原始尺寸
优势:相比大核卷积保留细节,相比全局注意力计算高效
适用:飞机、直升机等不规则目标
低质量特征增强(LFEA)
设计动机:遥感图像常因分辨率和距离限制导致目标模糊
阶段1(浅层1/4下采样):边缘增强
使用Scharr滤波器提取水平和垂直边缘
计算边缘响应的欧几里得范数
与原始特征融合后通过卷积块细化
作用:保留详细边缘信息,增强目标边界
阶段2-4(深层):高斯建模
使用固定高斯核进行深度可分离卷积
高斯核对中心像素赋予更高权重,抑制噪声
作用:建模特征不确定性,增强模糊区域的显著特征
最终融合
边缘/高斯增强特征通过卷积块处理后与原始特征相乘
应用全局平均池化和自适应一维卷积生成通道注意力
突出关键通道,抑制冗余信息
实验与分析
UnravelNet在四个主流遥感目标检测基准数据集上均达到当前最优性能,相比ResNet-50基线在参数量减少约40%的情况下实现显著精度提升,特别是在小目标、低质量目标和不规则形状目标类别上取得突破性改进。消融实验验证了四个注意力模块的互补性和有效性,同时模型在自然图像数据集COCO和多种检测框架上的优异表现证明了其强大的跨域泛化能力和通用性。

2025-11-15
2025-11-11
2025-11-03
2025-10-01

欢迎关注
分享遥感与深度学习领域的技术、论文、书籍、新鲜事。
欢迎加入遥感与深度学习交流群(点此加入)。


