CVPR 2025背书，小波变换+Mamba，错过Transformer，别错过这波红利- 大数跨境

CVPR 2025背书，小波变换+Mamba，错过Transformer，别错过这波红利

AI前沿速递

2026-01-07

导读：CVPR 2025背书，小波变换+Mamba，错过Transformer，别错过这波红利

“Mamba+小波变换”正成为计算机视觉和遥感领域的前沿热点。该方向通过小波变换的多尺度特征提取能力与Mamba模型高效的长序列建模优势互补，在图像重建、分类等任务中展现出显著潜力，近期在IEEE TGRS、CVPR等顶会顶刊上成果频出，正值研究活跃期。

其核心在于利用小波变换将数据分解为不同频率的子带（如低频轮廓与高频细节），再由Mamba模块分别进行针对性建模，实现更精准的全局与局部信息捕获。相关工作如用于时空预测的WaveST-Mamba、用于高光谱图像处理的WD-SSMamba等，均是这一思路的体现。

对于希望切入的研究者，可沿以下路径探索：追求快速验证可从架构创新入手，设计新的融合机制；追求理论深度可分析其频域建模原理；也可通过复现改进现有工作（如CVPR‘25的MobileMamba）来寻找突破。建议精读近半年顶会论文，把握其技术演进脉络。

扫码添加小助手回复“C469”

免费获取全部论文+开源代码

论文一：(CVPR 2025) MobileMamba: Lightweight Multi-Receptive Visual Mamba Network

关键词: Lightweight, Visual Mamba, Wavelet Transform, Multi-Receptive Field, Image Classification

研究方法:

针对现有轻量级模型在长距离依赖建模与推理速度之间难以兼顾的具体问题，论文提出了名为MobileMamba的轻量级网络解决方案。其核心工作原理在于设计了一个高效的“多感受野特征交互（MRFFI）”模块。该模块并没有简单地堆叠层数，而是巧妙地将输入特征在通道维度一分为三：第一部分通过长距离小波变换增强Mamba（WTE-Mamba），利用小波变换提取高频细节并结合Mamba进行全局建模；第二部分采用多核深度卷积（MK-DeConv）捕捉多尺度的局部感受野；第三部分则保留恒等映射以减少冗余。最终，通过这种三路并行处理，模型在保持低计算量的同时，实现了对全局语义和局部纹理的全面捕捉。

论文创新点:

构建了MobileMamba轻量级三阶段网络框架，实现了在同等FLOPs下比现有CNN和ViT模型更高的准确率与推理速度。
创新地引入了多感受野特征交互（MRFFI）模块，解决了单一Mamba结构难以同时兼顾全局信息与高频边缘细节提取的问题。
通过引入小波变换与Mamba结合的机制，将捕捉全局依赖的计算效率大幅提升，推理速度比LocalVim快21倍。
首次将多核深度卷积与视觉Mamba机制并行结合，验证了混合感受野设计在轻量级视觉任务中的卓越有效性。

论文链接: https://arxiv.org/pdf/2411.15941v1.pdf

扫码添加小助手回复“C469”

免费获取全部论文+开源代码

论文二：(ICCV 2025) WaveMamba: Wavelet-Driven Mamba Fusion for RGB-Infrared Object Detection

关键词: Object Detection, Mamba, Wavelet Transform, Multi-modal Fusion, RGB-IR

研究方法:

针对RGB与红外（IR）图像在特征融合时难以有效利用互补频率特性（RGB富含高频纹理，IR富含低频轮廓）的具体问题，论文提出了名为WaveMamba的跨模态融合检测网络。其核心架构利用离散小波变换（DWT）将图像分解为不同频带。随后，通过核心组件WaveMamba融合块（WMFB）进行处理：对于低频分量，设计了低频Mamba融合块（LMFB），利用Mamba的线性序列建模能力进行深层交互与门控选择；对于高频分量，则采用高频增强（HFE）策略保留显著细节。最后，改进的检测头利用逆小波变换（IDWT）无损还原特征，从而在极低的计算成本下实现了高质量的多模态特征融合。