大数跨境
0
0

CVPR2024|Dropout之后又一改善图像超分泛化性能的正则方案SimpleAlign,已开源!

CVPR2024|Dropout之后又一改善图像超分泛化性能的正则方案SimpleAlign,已开源! 极市平台
2024-03-04
1
↑ 点击蓝字 关注极市平台
作者丨AIWalker
来源丨AIWalker
编辑丨极市平台

极市导读

 

本文提出了另一种简单而有效的训练策略,通过简单地调整模型的一阶和二阶特征统计量来增强模型的泛化能力。实验结果表明,该方法可以作为与模型无关的正则化,并且在七个基准数据集(包括合成场景和真实场景)上优于 Dropout。 >>加入极市CV技术交流群,走在计算机视觉的最前沿

https://arxiv.org/abs/2402.18929v1
https://github.com/Dreamzz5/Simple-Align

论文概述

深度学习为图像超分辨率(SISR)带来了性能上的巨大飞跃。大多数现有工作都假设一个简单且固定的退化模型(例如双三次下采样),但 Blind SR 的研究旨在提高未知退化情况下的模型泛化能力。最近,Kong等人率先研究了一种更适合使用 Dropout 的 Blind SR 训练策略RDSR。尽管这种方法确实通过减轻过度拟合带来了实质性的泛化改进,但我们认为 Dropout 同时引入了不良的副作用,损害了模型忠实重建精细细节的能力

我们在论文中展示了理论和实验分析,此外,我们提出了另一种简单而有效的训练策略,通过简单地调整模型的一阶和二阶特征统计量来增强模型的泛化能力。实验结果表明,我们的方法可以作为与模型无关的正则化,并且在七个基准数据集(包括合成场景和真实场景)上优于 Dropout

发出点

从图2中,我们观察到,正如预期,使用Dropout训练的模型在高频恢复方面表现较差。值得注意的是,大约 90% 的图像包含低频信号,而人类的感知对图像的高频细节自然敏感。因此,失去高频恢复能力通常会导致感知质量不理想

此外,Dropout 还倾向于通过像低通滤波器一样平滑网络的激活来减少特征多样性。如上图3所示,Dropout 训练的模型覆盖了较小的频带范围,限制了其恢复能力在此范围之外。

本文方案

我们从图像风格迁移中汲取灵感,并将不同退化的图像视为不同风格。然后,我们遵循风格迁移的传统,利用均值和协方差作为退化(风格)敏感指标。因此,通过在具有相同内容但不同退化的图像之间对齐这些统计数据,我们的目标是引导模型在特征编码过程中自动忽略特定于退化的信息,从而提高其对退化不变特征的学习能力

伴随退化建模的进步,多重退化的训练模型已成为最近 Blind SR 工作的标准。我们的方法与它们无缝集成,只需要求退化模型为每个(或某些)图像随机生成一个退化图像以形成对进行正则化即可

本文实验

公众号后台回复“数据集”获取100+深度学习各方向资源整理

极市干货

技术专栏:多模态大模型超详细解读专栏搞懂Tranformer系列ICCV2023论文解读极市直播
极视角动态欢迎高校师生申报极视角2023年教育部产学合作协同育人项目新视野+智慧脑,「无人机+AI」成为道路智能巡检好帮手!
技术综述:四万字详解Neural ODE:用神经网络去刻画非离散的状态变化transformer的细节到底是怎么样的?Transformer 连环18问!

点击阅读原文进入CV社区

收获更多技术干货

【声明】内容源于网络
0
0
极市平台
为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
内容 8155
粉丝 0
极市平台 为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
总阅读197
粉丝0
内容8.2k