大数跨境
0
0

增强算法一定有效吗? 无需增强,直接训练,解决低光照场景下的目标检测问题(ICCV 2021)

增强算法一定有效吗? 无需增强,直接训练,解决低光照场景下的目标检测问题(ICCV 2021) 极市平台
2022-10-10
0
↑ 点击蓝字 关注极市平台

作者丨信息门下奶狗@知乎(已授权)
来源丨https://www.zhihu.com/question/493246711/answer/2209905715
编辑丨极市平台

极市导读

 

对暗光场景下的high-level vision task中存在的一些问题:1.图像质量差 2.图像增强手段容易失效 3.数据集规模小,作者提出了一种新的多任务自动编码转换(MAET)模型。该工作已经收录于ICCV2021。 >>加入极市CV技术交流群,走在计算机视觉的最前沿

ICCV 2021: Multitask AET with Orthogonal Tangent Regularity for Dark Object Detection,一篇针对于暗光场景目标检测任务的paper。

纯粹的low-level vision task已经有很多好的工作了,推荐一下自己今年的ICCV 2021的paper,暗光场景在增强之外还有高层次视觉任务可以做,做的是暗光场景下的high-level-vision task目标检测任务。

暗光场景下的high-level vision task,比如检测分割分类这种,往往受限于三个显著的缺点,第一是环境中的光子数量很少,而且相机中的in-camra noise很大。第二是直接用图像增强手段,增强的评价指标是PSNR和SSIM(人眼视觉),而High-level-vision task的评价指标是mAP和IOU这类(机器视觉),导致了评价指标不一致性。第三是暗光场景下的数据集很少,无法像COCO,ImageNet那样有大规模的数据集训练。

图1. 暗光增强方法的效果往往容易失效。

我2021年的ICCV 2021 paper就是为了解决以上问题而写出,无需增强,直接训练,也可以达到SOTA 效果。写贴一下论文和代码地址:

论文:Multitask AET with Orthogonal Tangent Regularity for Dark Object Detection

论文链接:https://openaccess.thecvf.com/content/ICCV2021/papers/Cui_Multitask_AET_With_Orthogonal_Tangent_Regularity_for_Dark_Object_Detection_ICCV_2021_paper.pdf

代码地址:https://github.com/cuiziteng/ICCV_MAET

在这篇工作中,针对上述的三个问题(1.图像质量差 2.图像增强手段容易失效 3.数据集规模小)。我们采用了另辟蹊径的手段:没有直接把enhancement应用到图像上,而是采用传统相机图像信号处理(image signal processor, ISP)的方法,把大规模数据集(如COCO)上面的正常图像转化为暗光图像,这里面涉及到把图像从RGB空间转换到RAW空间(Unprocess过程),并且在RAW空间上完成了Low-light Degradation,最终再通过一个正向的ISP过程把RAW还原为暗光RGB。

图2.暗光图像合成流程

其次,我们把正常图像和其合成的暗光图像一起输入到一个孪生神经网络里面进行自监督学习训练,我们采用的自监督学习方法是AET (Auto-Encoding Transformation, CVPR 2019)。我们通过在backbone后面接入的变换预测decoder来预测光照变换中涉及的参数从而完成自监督训练。我们采用检测数据集MS COCO来完成暗光图像的合成步骤,并且参与自监督training,在检测网络的backbone(E)上面同时接入了目标检测的decoder(Dobj)和AET变换预测的decoder(Ddeg),训练的时候同时优化E, Dobj和Ddeg的参数,进行一个multi-task的训练学习,并且在后续真实数据集上(EXDark ,UG2+ Dark Face)上面直接进行fine-tuing。

图3.同时完成自监督和合成数据集上的目标检测

实验部分我们在EXDark 和 UG2+人脸检测数据集上都做了探究,只用暗光图像作为输入,不需要任何预处理和辅助的增强手段。在对比实验的增强手段中,无监督增强手段(如Zero-DCE)更适合暗光目标检测任务,这也许是因为无监督方法的泛化性能更好。最终我们的方法在EXDark和UG2+数据集都取得了理想的效果。

图4.EXDark数据集实验效果图,(a)是原始暗光图(b,c,d)是不同增强手段(e)是原始暗光图输入到MAET中

值得一提的是,我们后续在BMVC 2022上做了一篇Transformer来完成暗光增强新论文,借鉴目标检测中的DETR结构,利用了attention query机制来学习ISP流程的相关参数,并且在这篇我们研究中我们同时探究了暗光增强,暗光场景下的目标检测与暗光场景下的语义分割任务,并且这篇的结构所需参数量和速度都十分轻量,链接如下:

You Only Need 90K Parameters to Adapt Light: A Light Weight Transformer for Image Enhancement and Exposure Correction (BMVC 2022)

https://arxiv.org/abs/2205.14871

https://github.com/cuiziteng/Illumination-Adaptive-Transformer

公众号后台回复“开学”获取CVPR、ICCV、VALSE等资源合集~

极市干货
算法竞赛:国际赛事证书,220G数据集开放下载!ACCV2022国际细粒度图像分析挑战赛开赛!
技术综述BEV 学术界和工业界方案、优化方法与tricks综述PyTorch下的可视化工具(网络结构/训练过程可视化)
极视角动态:极视角与华为联合发布基于昇腾AI的「AICE赋能行业解决方案」算法误报怎么办?自训练工具使得算法迭代效率提升50%!

CV技术社群邀请函 #



△长按添加极市小助手
添加极市小助手微信(ID : cvmart2)

备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳)


即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群


极市&深大CV技术交流群已创建,欢迎深大校友加入,在群内自由交流学术心得,分享学术讯息,共建良好的技术交流氛围。

点击阅读原文进入CV社区

收获更多技术干货

【声明】内容源于网络
0
0
极市平台
为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
内容 8155
粉丝 0
极市平台 为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
总阅读3.2k
粉丝0
内容8.2k