大数跨境
0
0

ISPRS | UnravelNet: 安徽大学等提出遥感目标检测新backbone, 应对低质量图像和小目标问题!代码开源

ISPRS | UnravelNet: 安徽大学等提出遥感目标检测新backbone, 应对低质量图像和小目标问题!代码开源 遥感与深度学习
2025-11-24
0
导读:UnravelNet: A backbone for enhanced multi-scale and low-quality feature extraction in remote sensing

 RS   DL 

题目UnravelNet: A backbone for enhanced multi-scale and low-quality feature extraction in remote sensing object detection

期刊:ISPRS Journal of Photogrammetry and Remote Sensing

论文https://doi.org/10.1016/j.isprsjprs.2025.11.002

代码:https://github.com/lwCVer/UnravelNet

单位:安徽大学,南京理工大学,香港中文大学

原作者审阅认证

创新点


  • 非扩展性多分支注意力机制:通过通道分割而非扩展,设计PA、LA、SMRA三种注意力模块,在不增加参数和计算量的前提下高效提取点级、局部和中程多尺度特征。

  • 低质量特征增强模块(LFEA):针对遥感图像模糊和低质量特征问题,在浅层使用Scharr边缘检测,深层采用高斯分布建模不确定性,显著提升退化特征的表示能力。

  • 解耦式特征提取策略:通过将输入特征沿通道维度均分为四个独立分支,利用特征冗余性实现参数高效的多尺度和低质量特征并行建模。

  • 参数效率与精度平衡:UnravelNet-S以14.0M参数(ResNet-50的60%)在DOTA-v1.0上达到79.99% mAP的SOTA性能,特别在小目标(SP: +6.94%)和低质量目标(HC: +10.88%)类别上取得显著提升。

背景


遥感目标检测(RSOD)面临两大核心挑战:单张图像中目标尺度变化极大(从小车辆到大型机场)以及由于卫星成像限制导致的低质量特征(模糊、边缘不清)。

现有方法如LSKNet采用大核卷积捕获多尺度信息,但分辨率粗糙难以提取细节特征且对小目标效率低;PKINet使用多尺度卷积核处理不同尺度目标,但在低质量或模糊目标上提取效果不佳。这些方法的根本问题在于未能同时有效解决多尺度特征提取与低质量特征增强,且在捕获全局信息时牺牲了细节和边缘信息。因此,本文提出UnravelNet,通过非扩展性多分支注意力机制将不同尺度特征提取解耦(点、局部、中程注意力),并结合边缘信息和高斯分布专门增强低质量特征,在有限参数下实现高效、精准的遥感目标检测。

          数据


          遥感目标检测(RSOD)数据集

          DOTA-v1.0

          • 2,806张图像,188,282个实例,15个类别

          • 分辨率:800×800至4000×4000像素

          • 划分:训练集1,411张,验证集458张,测试集937张

          DOTA-v1.5

          • 与v1.0图像数量相同,但新增容器起重机(CC)类别

          • 403,318个实例(包含小于10像素的微小实例),16个类别

          DIOR-R

          • 23,463张图像,192,518个实例,20个类别

          • 训练+验证集:11,725张,测试集:11,738张

          • 图像分辨率:800×800像素

          FAIR1M-v1.0

          • 超过40,000张图像,100万+实例,37个细粒度类别

          • 训练集:16,488张,测试集:8,137张

          自然图像数据集

          COCO 2017

          • 用于验证模型的跨域泛化能力

          • 在Mask R-CNN框架下测试

          方法


          整体架构

          四阶段设计网络包含4个阶段,下采样率为1/4、1/8、1/16、1/32

          由Stem层(4×4卷积初始下采样)、DRFD下采样模块、Unravel Block组成

          四阶段输出特征送入检测器完成目标检测

          Unravel Block

          • 核心模块,包含Unravel模块、两个1×1卷积、归一化层和残差连接

          • Unravel模块是创新核心,实现多分支特征提取

          多分支注意力机制(核心创新)

          设计思想

          • 将输入特征沿通道维度均分为4个独立分支

          • 每个分支处理不同尺度或质量的特征,最后拼接融合

          • 通过通道分割而非扩展,实现参数高效

          1. 点注意力(PA)

          目标:提取极小和精细特征

          方法:通过两个1×1卷积和Sigmoid生成注意力图,增强小目标特征

          适用:小车辆等微小目标检测

          2. 局部注意力(LA)

          目标:捕获局部邻域上下文

          方法:使用标准3×3卷积提取局部特征

          适用:网球场、棒球场等规则形状目标

          3. 稀疏中程注意力(SMRA)

          目标:捕获中等范围的结构信息

          方法:

            • 先最大池化下采样扩大感受野

            • 采用水平、垂直、对角线四个方向的直线注意力

            • 在距离L=11范围内聚合特征并学习权重

            • 插值恢复原始尺寸

          优势:相比大核卷积保留细节,相比全局注意力计算高效

          适用:飞机、直升机等不规则目标

          低质量特征增强(LFEA)

          设计动机:遥感图像常因分辨率和距离限制导致目标模糊

          阶段1(浅层1/4下采样):边缘增强

          • 使用Scharr滤波器提取水平和垂直边缘

          • 计算边缘响应的欧几里得范数

          • 与原始特征融合后通过卷积块细化

          • 作用:保留详细边缘信息,增强目标边界

          阶段2-4(深层):高斯建模

          • 使用固定高斯核进行深度可分离卷积

          • 高斯核对中心像素赋予更高权重,抑制噪声

          • 作用:建模特征不确定性,增强模糊区域的显著特征

          最终融合

          • 边缘/高斯增强特征通过卷积块处理后与原始特征相乘

          • 应用全局平均池化和自适应一维卷积生成通道注意力

          • 突出关键通道,抑制冗余信息

          实验与分析


          UnravelNet在四个主流遥感目标检测基准数据集上均达到当前最优性能,相比ResNet-50基线在参数量减少约40%的情况下实现显著精度提升,特别是在小目标、低质量目标和不规则形状目标类别上取得突破性改进。消融实验验证了四个注意力模块的互补性和有效性,同时模型在自然图像数据集COCO和多种检测框架上的优异表现证明了其强大的跨域泛化能力和通用性。

          更多图表分析可见原文 



          我们目前有交流群,包括作者群、竞赛群及语义分割、变化检测等方向群。详见:交流群说明


          欢迎优秀作者投稿,我们免费发布推广您的成果!投稿说明请查看:投稿说明

          如需加群、投稿、合作,请扫描上方二维码联系小助手,请备注:”咨询/投稿/合作/加群“+"姓名/昵称"+”单位"+"研究方向"
          往期推荐

          AAAI2026 | 南开大学提出面向多模态遥感目标检测的统一模型, 数据代码开源!

          2025-11-15

          顶刊TPAMI | 南开大学等提出基于差分卷积神经网络的快速显著性目标检测方法

          2025-11-11

          最新论文 | TerraGen: 根据目标检测/分割等标注数据生成遥感图像! 西安交大等提出用于遥感数据增强的统一多任务生成框架

          2025-11-03

          最新论文 | SAM-SPL: 香港浸会/西工大提出基于SAM引导自提示学习的统一红外小目标检测框架

          2025-10-01

            欢迎关注  


          分享遥感与深度学习领域的技术、论文、书籍、新鲜事。



          欢迎加入遥感与深度学习交流群(点此加入)

          【声明】内容源于网络
          0
          0
          遥感与深度学习
          聚焦遥感与深度学习,分享相关技术、论文、书籍、资讯,团队来自国内外著名期刊作者及审稿人
          内容 518
          粉丝 0
          遥感与深度学习 聚焦遥感与深度学习,分享相关技术、论文、书籍、资讯,团队来自国内外著名期刊作者及审稿人
          总阅读247
          粉丝0
          内容518