大数跨境
0
0

CVPR 2021|近期半监督学习必读论文

CVPR 2021|近期半监督学习必读论文 AMiner AI
2021-05-28
1
导读:论文可直接下载

半监督学习(Semi-Supervised Learning,SSL)是模式识别和机器学习领域研究的重点问题,是监督学习与无监督学习相结合的一种学习方法。

半监督学习使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作。当使用半监督学习时,将会要求尽量少的人员来从事工作,同时,又能够带来比较高的准确性,因此,半监督学习正越来越受到人们的重视。

本文推荐大家5篇CVPR2021 半监督学习论文,收藏之后可以用AI技术解读论文哦!

1.论文名称:3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object Detection

论文链接:https://www.aminer.cn/pub/5fd0ab9e91e01147f1d1e3b1?conf=cvpr2021

简介:3D对象检测是一项重要而又艰巨的任务,在很大程度上依赖于难以获得3D注释。为了减少所需的监督量,我们提出了3DIoUMatch,这是一种用于半监督3D对象检测的新方法。我们采用流行的基于点云的对象检测器VoteNet作为我们的骨干,并利用师生相互学习框架以伪标签的形式将信息从标记的传播到未标记的训练集。但是,由于任务的复杂性高,我们注意到伪标签遭受很大的噪音,因此不能直接使用。为此,我们引入了一种基于置信度的过滤机制。我们方法的关键是新颖的可微分3D IoU估算模块。该模块用于过滤本地化较差的提案以及IoU引导的边界框重复数据删除。在推论时间,该模块被进一步用于通过测试时间优化来改善本地化。


2.论文名称:Semi-Supervised Action Recognition with Temporal Contrastive Learning

论文链接:https://www.aminer.cn/pub/601d3d6691e01194579224f0?conf=cvpr2021

简介:由于缺乏乏味收集的活动标签,学会仅从少数带有标签的视频中识别动作是一个具有挑战性的问题。我们通过利用未标记的视频以两种不同的速度学习两条路径的时间对比模型来解决此问题,从而利用了改变视频速度不会改变动作的事实。具体来说,我们建议以两个不同的速度最大化同一视频的编码表示之间的相似度,并以不同的速度最小化不同视频之间的相似度。这样,我们就可以在“无人看管”的视频库中以“时间”的形式使用丰富的监管信息。通过这种简单而有效的操纵视频播放速率的策略,我们在多种多样的基准数据集和网络体系结构上,大大胜过了先进的,先进的半监督图像识别方法的视频扩展。有趣的是,我们提出的方法得益于域外未标记视频的显示泛化和鲁棒性。我们还进行了严格的消融和分析,以验证我们的方法。

3.论文名称:Semi-Supervised Video Deraining with Dynamic Rain Generator

论文链接:https://www.aminer.cn/pub/605085c691e0111e1cd46af2?conf=cvpr2021

简介:尽管最近基于深度学习(DL)的视频排空方法取得了巨大的成功,但它们仍然存在两个主要缺点。首先,它们中的大多数不能充分模拟多雨视频的雨层特征。实际上,雨层在空间维度上表现出很强的物理特性(例如,方向,尺度和厚度),在时间维度上表现出自然的连续性,因此通常可以通过统计中的时空过程来建模。其次,当前基于DL的方法严重依赖于标记的合成训练数据,其雨水类型总是与未标记的真实数据中的雨水类型有所不同。在实际场景中应用综合数据集和实际数据集之间的这种差距会导致性能不佳。针对这些问题,本文提出了一种新的半监督视频排水方法,该方法采用动态雨水产生器来拟合雨水层,以期更好地描述其富有洞察力的特征。具体而言,这种动态发生器由一个排放模型和一个过渡模型组成,分别对雨条纹的空间物理结构和时间连续变化进行编码,这两个参数均被设置为深度神经网络(DNN)。此外,为标记的合成和未标记的真实数据设计了不同的现有格式,以便充分利用它们背后的常识。最后但并非最不重要的一点是,我们还设计了Monte Carlo EM算法来解决该模型。进行了广泛的实验,以验证所提出的半监督排水模型的优越性。


4.论文名称:Data-Uncertainty Guided Multi-Phase Learning for Semi-Supervised Object Detection

论文链接:https://www.aminer.cn/pub/60645fb491e011538305d0ec?conf=cvpr2021

简介:在本文中,我们深入研究了半监督对象检测,其中利用未标记图像突破了全监督对象检测模型的上限。先前基于伪标签的半监督方法会因噪声而严重退化,并容易过度适合嘈杂的标签,因此无法很好地学习不同的未标记知识。为了解决这个问题,我们提出了一种用于半监督目标检测的数据不确定性指导的多阶段学习方法。我们根据未标记图像的难易程度综合考虑了不同类型的图像,将其用于不同阶段,并将来自不同阶段的集成模型结合在一起以产生最终结果。图像不确定性指导的轻松数据选择和区域不确定性指导的RoI重加权涉及多阶段学习,并使检测器能够专注于更多确定的知识。通过在PASCAL VOC和MS COCO上进行的广泛实验,我们证明了与基线方法相比,我们的方法表现异常出色,并且性能大大优于基线方法,VOC超过3%,COCO超过2%。


5.论文名称:Semi-supervised Synthesis of High-Resolution Editable Textures for 3D Humans

论文链接:https://www.aminer.cn/pub/6065b56991e011d10ad615c3?conf=cvpr2021

简介:我们介绍了一种新颖的方法,可以在半监督的设置中为3D人体网格生成各种高保真纹理贴图。给定一个定义纹理图中语义区域布局的分割蒙版,我们的网络将生成具有多种样式的高分辨率纹理,然后将其用于渲染目的。为了完成此任务,我们提出了一种区域自适应对抗变分自动编码器(ReAVAE),该算法可单独学习每个区域样式的概率分布,以便可以通过从特定于区域的分布中进行采样来控制生成纹理的样式。此外,我们引入了一种数据生成技术,通过从单视图RGB输入中提取的数据来扩展我们的训练集。我们的培训策略允许将参考图像样式与不同区域的任意样式混合在一起,该属性对于虚拟试戴式AR / VR应用程序可能很有价值。实验结果表明,与先前的工作相比,我们的方法能够合成更好的纹理贴图,同时能够实现独立的布局和样式可控性。



阅读原文,直达“CVPR2021”会议专题,了解更多会议论文!

【声明】内容源于网络
0
0
AMiner AI
AI帮你理解科学
内容 212
粉丝 0
AMiner AI AI帮你理解科学
总阅读100
粉丝0
内容212