
1
陈使明
零样本学习的关键问题研究
针对当前机器学习模型过于依赖于大规模有标注或无标注数据这一问题,零样本学习(Zero-shot Learning)这一新的学习范式近年来受到广泛关注。零样本学习旨在通过运用已获取的知识去认知未知类,从而使得机器学习系统具备不断学习的能力。当前零样本学习依托于额外的辅助信息(如,属性描述)得以实现,其关键在于如何准确地表示视觉和属性语义之间的交互,例如,视觉→语义(基于语义嵌入的模型)、语义→视觉(生成模型)、视觉→子空间&语义→子空间(公共子空间学习模型)。通过对这些技术的深度研究分析,他们发现当前零样本学习面临跨数据集偏差、视觉-属性的关键公共语义表示、视觉-语义的异构特征对准等问题。
直播回放及PPT下载:
https://www.cvmart.net/community/detail/6374
唐业辉
CVPR 2022:量子启发的新型视觉主干模型WaveMLP
视觉 MLP 具有极其简单的架构,它仅由多层感知器(MLP)堆叠而成。与 CNN 和 Transformer 相比,这些简洁的 MLP 架构引入了更少的归纳偏置,具有更强的泛化性能。他们受到量子力学中波粒二象性的启发,将 MLP 中每个图像块 (Token) 表示成波函数的形式,从而提出了一个新型的视觉 MLP 架构——Wave-MLP,在性能上大幅超越了现有 MLP以及 Transformer架构。
直播回放:
https://www.cvmart.net/community/detail/6375
陈启峰
图像处理与复原中的可逆性问题
目前智能手机已经实现了美图、风格转换等炫酷的视觉效果。在互联网和手机APP上,我们会分享这种各样处理后的JPEG 图像。然而,对于摄影师和研究人员来说,保留原始相机数据可以进一步进行后期的图像处理和数据分析。但是,原始相机数据往往文件非常大,这阻碍了其在现实中的普及应用。那么我们能否从JPEG 图像中完美地恢复原始数据,从而避免存储任何原始数据呢?
“这个问题引导我们设计一个可逆的图像信号处理框架。之后,我们进一步探索其他图像处理和复原中的可逆性问题,包括图像压缩、可逆图像转换(例如图像到视频的转换)、在单个 JPEG 图像中嵌入新视图模型。最后,我们介绍了一个Quasi-Invertible Network框架可以在现有图像处理算法中嵌入可逆性。”
直播回放及PPT下载:
https://www.cvmart.net/community/detail/6376
王腾飞
CVPR 2022:处理速度仅用0.2秒!真实图像的高保真度编辑探索
随着生成对抗网络(GAN)的快速发展,一个可能的方向是利用 GAN 的强大生成能力来编辑图像。为了实现真实图像的编辑,GAN 反演技术最近被广泛研究。但是编辑质量、重建保真度与处理速度之间的平衡仍待解决。
“High-Fidelity GAN Inversion for Image Attribute Editing (CVPR 2022)。我们首先从信息压缩的视角,分析了高保真 GAN 反演问题存在的挑战。进一步地,我们提出了一种新的通用方法以提升现有模型的图像重建质量。”
直播回放及PPT下载:
https://www.cvmart.net/community/detail/6377
聂浪
CVPR22 Oral:用深度学习探索图像变形:以图像拼接矩形化为例
针对当前机器学习模型过于依赖于大规模有标注或无标注数据这一问题,零样本学习(Zero-shot Learning)这一新的学习范式近年来受到广泛关注。零样本学习旨在通过运用已获取的知识去认知未知类,从而使得机器学习系统具备不断学习的能力。当前零样本学习依托于额外的辅助信息(如,属性描述)得以实现,其关键在于如何准确地表示视觉和属性语义之间的交互,例如,视觉→语义(基于语义嵌入的模型)、语义→视觉(生成模型)、视觉→子空间&语义→子空间(公共子空间学习模型)。通过对这些技术的深度研究分析,他们发现当前零样本学习面临跨数据集偏差、视觉-属性的关键公共语义表示、视觉-语义的异构特征对准等问题。
直播回放及PPT下载:
https://www.cvmart.net/community/detail/6374
郑兆晖
CVPR 2022:目标检测定位蒸馏
针对当前机器学习模型过于依赖于大规模有标注或无标注数据这一问题,零样本学习(Zero-shot Learning)这一新的学习范式近年来受到广泛关注。零样本学习旨在通过运用已获取的知识去认知未知类,从而使得机器学习系统具备不断学习的能力。当前零样本学习依托于额外的辅助信息(如,属性描述)得以实现,其关键在于如何准确地表示视觉和属性语义之间的交互,例如,视觉→语义(基于语义嵌入的模型)、语义→视觉(生成模型)、视觉→子空间&语义→子空间(公共子空间学习模型)。通过对这些技术的深度研究分析,他们发现当前零样本学习面临跨数据集偏差、视觉-属性的关键公共语义表示、视觉-语义的异构特征对准等问题。
直播回放及PPT下载:
https://www.cvmart.net/community/detail/6374
韩鸣飞
CVPR 2022 Oral:
Dual-AI:基于互补时空建模的群体行为识别
“在群体行为识别的以往工作中,研究者仅使用了单个路径的时空建模,忽略了时间-空间不同建模顺序带来的互补性。
在我们的实验中,融合了互补时空建模的Dual-AI不仅在多个数据集和监督设置下达到目前最优;在Volleyball Dataset上,可以用50%的数据达到其他方法100%数据的精度,充分验证了互补时空建模的有效性。”
孔祥涛
CVPR2022:让Dropout在图像超分中重焕光彩
直播回放及PPT下载:
https://www.cvmart.net/community/detail/6400
李哲远
NTIRE22 冠军方案:用于轻量级图像超分辨率的蓝图可分离残差网络
“卷积分解的方法在过去几乎从未被用在轻量级超分网络上,我们通过使用蓝图可分离卷积,实现了仅仅包含非常轻量的参数量和计算量的超分网络BSRN。在参数量小于现有轻量超分方法的情况下,性能大幅度提升。”
直播回放及PPT下载:
https://www.cvmart.net/community/detail/6425
△点击卡片关注极市平台,获取最新CV干货
“
点击阅读原文进入CV社区
收获更多技术干货

