图像修复和图像编辑是图像处理的重要基本任务,同时也一直是研究热点。
在这次分享中,我们邀请到了来自虎牙直播AI基础技术部的刘虹雨算法工程师,为我们介绍他团队在如何结合深度神经网络进行有效的图像修复和编辑这两个问题上的探索工作,两份工作都已经被CVPR2021收录。
多样性修复是指针对图像孔洞区域生成出多样的修复结果而非以往的单一结果,在PD-GAN中他们根据图像孔洞边缘生成内容确定性越大而中心确定性越小提出一种spatially probabilistic diversity normalization来解决多样性图像修复的问题,同时他们还提出了一种perceptual diversity loss 来提升多样性的效果。对于图像编辑,他们通过低层级控制信息如线条或者颜色来直接影响最后生成结果,DeFLOCNet中他们提出了一种有效的injection方式,帮助低层级控制信息(颜色和线条)有效的控制生成结果。
PD-GAN: Probabilistic Diverse GAN for Image Inpainting
本文提出一种非常自然的prior,即越靠近孔洞的中心其多样性越高,diverse越强,越靠近孔洞边缘其多样性越低越应该与上下文consistent起来,保证无缝链接,这样整个生成的图像就可以多样并且不突兀。通过采用vanilla GAN的框架,利用latent code对来影响孔洞内容,利用前面提到的prior本文很好地保证了GAN的特性就是多样性,同时也保证了生成内容能够与上下文融为一体。
DeFLOCNet: Deep Image Editing via Flexible Low level Controls
本文设计了Structure generation block, 把线条以及色彩看作孔洞区域的结构信息,并通过Spade Norm注入到feature中。同时,设计了Texture generation branch 辅助纹理的生成。最终提出了DeFLOCNet,并在图像编辑任务上取得了不错的效果。
在极市平台公众号后台回复“84”或“刘虹雨”即可获取PPT下载地址~
极市直播|CVPR 2021-刘虹雨:结合深度神经网络进行有效的图像修复和编辑
➤论文
1.PD-GAN: Probabilistic Diverse GAN for Image Inpainting
链接地址:https://arxiv.org/abs/2105.02201
2.DeFLOCNet: Deep Image Editing via Flexible Low level Controls
链接地址:https://arxiv.org/abs/2103.12723
1、个人介绍
2、图像编辑和修复的相关知识介绍
3、PDGAN的介绍
4、DeFLOCNet的介绍
➤回放视频在这里☟(建议在pc端观看)
➤部分PPT截图



B站:http://space.bilibili.com/85300886#!/
腾讯视频:http://v.qq.com/vplus/8be9a676d97c74ede37163dd964d600c
往期线上分享集锦:http://bbs.cvmart.net/topics/149/cvshare(或直接阅读原文)
如果觉得有用,就请分享到朋友圈吧!
公众号后台回复“84”获取第84期直播PPT~
推荐阅读
备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳)
即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群
每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~
觉得有用麻烦给个在看啦~