大数跨境
0
0

极市直播回放第120期丨ICCV2023-MFF: 简单高效的多级特征融合自监督方法

极市直播回放第120期丨ICCV2023-MFF: 简单高效的多级特征融合自监督方法 极市平台
2023-08-25
2
导读:附PPT下载地址
↑ 点击蓝字 关注极市平台

本次分享我们邀请到了上海人工智能实验室柳源,为大家详细介绍他们的工作:

Improving Pixel-based MIM by Reducing Wasted Modeling Capability(ICCV2023)

“图片掩码学习大致可以分为两个部分基于像素的图片掩码学习和基于高维表征的图片掩码学习。相较于后者,基于像素的图片掩码学习具有结构简单,计算开销小等有点,例如 MAE。但是,我们发现,这些基于像素的图片掩码学习方法倾向于关注在一些高频的信息上面,例如图片中的纹理,线条等,极大地消耗了模型去关注图片语义信息的精力。从这个点出发,我们首先验证了基于像素的图片掩码学习方法确实存在过度关注高频信息的问题,提出了通过在用于重建的高维特征中注入低维信息,让模型更关注提取图片的语义信息上。这种方案非常简单,能够轻易插入到大多数基于像素的图片掩码学习方法中。我们在 PixMIM 和 MAE 上进行了实验,发现了在各种任务上都有较大的提升。”

后台回复“极市直播”或点击阅读原文即可获取PPT
➤详情传送门
极市直播预告|ICCV2023-MFF: 简单高效的多级特征融合自监督方法


论文

Improving Pixel-based MIM by Reducing Wasted Modeling Capability

论文地址:

https://arxiv.org/pdf/2308.00261.pdf

代码地址:

https://github.com/open-mmlab/mmpretrain/tree/dev

回放视频在这里☟

https://www.bilibili.com/video/BV1iu4y1v7yR/

PPT内容截图(后台回复“极市直播”或点击阅读原文即可获取PPT)

往期视频在线观看
B站:http://space.bilibili.com/85300886#!/
腾讯视频:http://v.qq.com/vplus/8be9a676d97c74ede37163dd964d600c

往期线上分享集锦:http://m6z.cn/6qIJzE(或直接阅读原文

如果觉得有用,就请分享到朋友圈吧!

△点击卡片关注极市平台,获取最新CV干货


推荐阅读

# CV技术社群邀请函 #

△长按添加极市小助手
添加极市小助手微信(ID : cvmart2)

备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳)


即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群


每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~



觉得有用麻烦给个在看啦~  

【声明】内容源于网络
0
0
极市平台
为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
内容 8155
粉丝 0
极市平台 为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
总阅读919
粉丝0
内容8.2k