看了很多论文,创新点完全没头绪?或者好不容易找到个baseline,反复去看,去跑实验,却根本找不到破绽,模型无从改起……那我强烈推荐你用即插即用的模块进行缝合,即便小白,也能快速出文章!
这些模块通常都有标准的接口,可以很容易与其他模型结合,我们只需要不断实验,筛选出合适的模块,实现涨点,再讲故事即可!
为方便大家研究的顺利进行,我也给大家整理了265个即插即用模块和源码,主要来自CVPR等顶会。具体如下:
通用模块
・注意力机制50个 ・卷积34个
・特征提取29个 ・ 特征融合10个
・下采样8个 ・ 归一化12个
……
前沿技术
・ KAN 1个 ・ Mamba 17个
针对任务场景
・时间序列9个 ・图像分割21个
・目标检测7个 ・AI+医学7个
……
扫描下方二维码,回复「2025即插即用」
免费获取全部论文合集及项目代码
通用模块
U-RWKV: Lightweight medical image segmentation with direction-adaptive
内容:本文提出了一种名为U-RWKV的新型轻量级医学图像分割框架,旨在解决现有方法(如U-Net及其变体)有效感受野有限、难以捕捉长距离依赖的问题。U-RWKV基于Recurrent Weighted Key-Value(RWKV)架构,通过O(N)的计算成本实现高效的长距离建模。该框架引入了方向自适应RWKV模块(DARM)和阶段自适应挤压激励模块(SASE)两大创新点。DARM通过双RWKV和四向扫描机制聚合图像上下文信息,减少方向偏差并保持全局上下文;SASE则根据不同的特征提取阶段动态调整架构,平衡高分辨率细节保留和语义关系捕捉。实验结果表明,U-RWKV在保持高计算效率的同时,实现了最先进的分割性能,为在资源受限环境中普及先进的医学成像技术提供了实用解决方案。
Adaptive Rectangular Convolution for Remote Sensing Pansharpening
内容:本文提出了一种自适应矩形卷积模块,用于遥感图像融合中的全色锐化任务。ARConv能够动态调整卷积核的高度和宽度,并根据学习到的尺度动态改变采样点数量,以适应遥感图像中不同大小的目标。基于ARConv构建的ARNet网络在多个数据集上表现出色,显著优于现有的多种方法。此外,通过热力图可视化,ARConv能够根据目标大小调整卷积核形状,验证了其有效性和灵活性。
扫描下方二维码,回复「2025即插即用」
免费获取全部论文合集及项目代码
前沿技术
EfficientViM: Efficient Vision Mamba with Hidden State Mixer based State Space Duality
内容:本文提出了一种名为EfficientViM的新型轻量级视觉架构,基于隐藏状态混合器的态空间对偶性(HSM-SSD)。该架构通过在隐藏状态空间中进行通道混合操作,有效降低了计算成本,并引入多阶段隐藏状态融合机制以增强特征表示能力。EfficientViM在ImageNet-1k数据集上达到了新的速度与准确率权衡的最优解,相比第二好的模型SHViT,不仅性能提升了0.7%,而且速度更快。此外,该架构在高分辨率图像处理和知识蒸馏训练中展现出显著的性能提升,同时保持了较低的内存占用和高效的计算能力。
SCKansformer: Fine-Grained Classification of Bone Marrow Cells via Kansformer Backbone and Hierarchical Attention Mechanisms
内容:本文提出了一种名为SCKansformer的新型细粒度骨髓细胞分类模型,旨在解决现有方法在特征表达能力、可解释性和特征冗余方面的不足。该模型结合了Kansformer编码器、SCConv编码器和全局-局部注意力编码器(GLAE),通过改进的Kolmogorov-Arnold网络(KAN)提升非线性特征表达和可解释性,利用空间和通道重构单元减少特征冗余,并结合多头自注意力和局部模块捕捉全局与局部特征。实验结果表明,SCKansformer在私有的骨髓细胞细粒度分类数据集(BMCD-FGCD)以及公开的PBC和ALL-IDB数据集上均优于现有的先进微细胞分类方法。此外,作者还发布了包含超过10,000个样本和近40个分类的BMCD-FGCD数据集,以促进该领域的研究。
针对具体任务
Adaptive Multi-Scale Decomposition Framework for Time Series Forecasting
内容:本文提出了一种基于MLP的自适应多尺度分解(AMD)框架,用于时间序列预测(TSF)。AMD通过多尺度分解混合(MDM)模块将时间序列分解为多个时间尺度上的不同模式,并通过残差方式聚合这些模式。此外,AMD结合了双重依赖交互(DDI)模块和自适应多预测器合成(AMS)模块,有效建模时间和通道依赖关系,并利用自相关性优化多尺度数据整合。实验结果表明,AMD在长期和短期预测任务中均优于现有方法,展现出更高的效率和准确性。
Rethinking Generalizable Infrared Small Target Detection: A Real-scene Benchmark and Cross-view Representation Learning
内容:本文提出了一种针对红外小目标检测(ISTD)的通用框架,旨在解决不同数据集之间分布差异导致的模型泛化能力受限问题。该框架通过跨视图数据集对齐和融合策略,减少不同数据集间的域偏移,并引入噪声引导的表示学习策略,增强模型在不同噪声域中的泛化能力。此外,作者构建了一个包含多种形状、类别、姿态和传感器模态的跨域红外小目标数据集RealScene-ISTD,用于评估模型在跨域数据条件下的泛化性能。实验结果表明,该方法在多个数据集上均取得了优异的性能,显著提升了ISTD模型在复杂环境中的泛化能力。
扫描下方二维码,回复「2025即插即用」
免费获取全部论文合集及项目代码

