大数跨境
0
0

TGRS | GSFANet: 浙大团队提出用于红外小目标检测的全局空-频注意力网络, 代码开源!

TGRS | GSFANet: 浙大团队提出用于红外小目标检测的全局空-频注意力网络, 代码开源! 遥感与深度学习
2025-12-01
2
导读:GSFANet: Global Spatial-Frequency Attention Network for Infrared Small Target Detection

 RS   DL 

题目GSFANet: Global Spatial-Frequency Attention Network for Infrared Small Target Detection

期刊IEEE Transactions on Geoscience and Remote Sensing (TGRS)

论文https://ieeexplore.ieee.org/abstract/document/11133697

数据SIRST, NUDT-SIRST, IRSTD-1k

代码https://github.com/dengfa02/GSFANet_IRSTD

年份:2025

单位浙江大学、电子科技大学、埃斯特雷马杜拉大学

原作者审阅认证

创新点


  • 参数化小波下采样 (PWD):提出了一种结合小波变换与分组卷积的可学习下采样模块,在进行频率细化的同时,有效保留了红外小目标的关键空间细节,防止特征在下采样中碎片化;

  • 分层门控核注意力 (HGKA):引入高斯核函数替代传统点积计算,捕捉高维非线性特征并降低计算复杂度;设计跨空间门控机制(CSG),确保了深层语义在跨层传输时的空间一致性,有效抑制虚警;

  • 自适应频率解耦融合 (AdaFD):在解码阶段,动态生成高通和低通滤波器,自适应地融合与目标相关的频率分量,在增强目标边缘细节的同时有效抑制背景噪声;

  • 自适应焦点损失 (AdaFL):提出了一种能够感知目标完整性的损失函数,通过自适应调整梯度权重,平衡了多尺度目标的训练,解决了红外小目标检测中严重的样本不平衡问题。

背景


  • 红外小目标检测(IRSTD)在单帧图像中面临着巨大的挑战:目标缺乏纹理、尺寸极小且易受复杂背景噪声干扰。现有的基于空间域的方法难以区分目标与相似的噪点,且容易破坏大尺度目标的完整性。虽然频域信息具有区分目标和噪声的潜力(见下图),但现有方法缺乏对频率分量的自适应选择能力。

  • 为了解决这些问题,本文提出了 GSFANet,从频域视角增强目标与噪声的分布差异,同时保留空间信息的完整性,实现“空频联合学习”。

          数据


          本研究在三个公开的红外小目标检测基准数据集上进行了实验:

          • SIRST 数据集:包含 427 张红外图像,目标尺寸主要集中在 1-10 像素之间,背景复杂多样。

          • NUDT-SIRST 数据集:包含 600 张红外图像,目标尺寸范围为 1-15 像素,具有更高的背景噪声水平。

          • IRSTD-1k 数据集:包含 1000 张红外图像,目标尺寸分布广泛,涵盖了多种复杂场景。

          方法

          GSFANet 采用编码器-解码器结构,主要由以下核心模块构成:
          • PWD 模块包含两个分支:固定 Haar 小波变换分支用于提供可解释的频率分解;基于分组卷积的分支用于模拟小波导向的局部对比度并补充空间细节。两者通过通道注意力进行融合。
          • 分层门控核注意力 (HGKA)旨在以低计算成本实现全局空频特征交互。它利用高斯核函数计算注意力,公式如下(泰勒展开近似):

             

          这使得型能够在无限维特征空间中衡量相似度,更适合红外小目标的高斯分布特性。同时,CSG 机制确保了跨层的空间注意力聚焦于一致的目标区域。

          • 在解码器端,AdaFD 将特征分组,并根据频率重要性动态生成低通滤波器 (𝑓𝐿) 和高通滤波器 (𝑓𝐻),分别用于提取语义和恢复细节。
          • 为了解决样本不平衡和训练后期梯度震荡问题,AdaFL 结合了 IoU 和目标尺寸自适应调整权重:

             

             

             

             

          • 其中α是目标尺寸缩放因子,使得小目标在训练中获得更大的梯度关注(见下图)。总的来看,AdaFL 有助于模型更好地学习多尺度目标的完整性,并根据训练阶段自适应调整目标梯度。

          实验与分析


            • 实验结果表明,GSFANet 在 SIRST、NUDT-SIRST 和 IRSTD-1k 三个数据集上均取得了优越的性能。相比于SOTA方法在IoU、$F_1$、$P_d$与上均有显著提升,同时保持了较低的虚警率$F_a$。

            • 可视化结果显示,GSFANet 能够准确检测出复杂背景下的微弱目标,并且在面对高斯噪声和散斑噪声干扰时表现出极强的鲁棒性。AdaFD 模块有效地保留了目标的形状边界,而 PWD 模块则确保了极小目标不丢失。

            更多图表分析可见原文


            Image



            我们目前有交流群,包括作者群、竞赛群及语义分割、变化检测等方向群。详见:交流群说明
            欢迎优秀作者投稿,我们免费发布推广您的成果!投稿说明请查看:投稿说明

            如需加群、投稿、合作,请扫描上方二维码联系小助手,请备注:”咨询/投稿/合作/加群“+"姓名/昵称"+”单位"+"研究方向"
            往期推荐

            TGRS 2025, 基于Mamba的小波变换特征在红外超分辨率研究应用

            2025-11-28

            最新论文 | SAM-SPL: 香港浸会/西工大提出基于SAM引导自提示学习的统一红外小目标检测框架

            2025-10-01

            PR | ADSUNet:基于累积差分的孪生 U-Net 用于帧间红外弱小目标检测, 代码开源

            2025-08-17

            ICCV2025 | 精准识别红外小目标位置和数量! 开源生态系统与动态解混框架

            2025-08-11

              欢迎关注  


            分享遥感与深度学习领域的技术、论文、书籍、新鲜事。



            欢迎加入遥感与深度学习交流群(点此加入)

            【声明】内容源于网络
            0
            0
            遥感与深度学习
            聚焦遥感与深度学习,分享相关技术、论文、书籍、资讯,团队来自国内外著名期刊作者及审稿人
            内容 518
            粉丝 0
            遥感与深度学习 聚焦遥感与深度学习,分享相关技术、论文、书籍、资讯,团队来自国内外著名期刊作者及审稿人
            总阅读223
            粉丝0
            内容518