大数跨境
0
0

极市直播预告|CVPR2024:视觉新骨干ViT-CoMer在密集预测任务中的应用

极市直播预告|CVPR2024:视觉新骨干ViT-CoMer在密集预测任务中的应用 极市平台
2024-03-26
0
导读:本周四晚八点,不见不散!
↑ 点击蓝字 关注极市平台

|极市线上分享第128期 |

一直以来,为让大家更好地了解学界业界优秀的论文和工作,极市已邀请了超过100位技术大咖嘉宾,并完成了127 期极市线上直播分享。

往期分享请前往bbs.cvmart.net/topics/149或直接阅读原文,也欢迎各位小伙伴自荐或推荐更多优秀的技术嘉宾到极市进行技术分享,与大家一起交流学习~~

本次分享我们邀请到了百度资深算法工程师夏春龙,为大家详细介绍他们中稿CVPR2024的工作:

ViT-CoMer: Vision Transformer with Convolutional Multi-scale Feature Interaction for Dense Predictions

GitHub:https://github.com/Traffic-X/ViT-CoMer

论文地址:https://arxiv.org/pdf/2403.07392.pdf

“尽Vision Transformer 在计算机视觉中取得了显著成功,但由于缺乏局部信息交互和特征尺度多样性有限,它在密集预测任务中的表现并不理想。大多数现有研究致力于设计特定的视觉transformer框架来解决上述问题,这增加了额外的预训练成本。
因此,我们提出了一种简洁的、无需预训练的、卷积多尺度特征增强的ViT骨干网络,命名为ViT-CoMer它解决了ViT尺度单一的问题,同时通过层级特征之间的相互交互,语义信息更加丰富与最先进的方案相比,ViT-CoMer能够在COCO val2017上达到了64.3% AP,在ADE20K val上达到了62.1% mIoU,均可与最先进的方法媲美。我们希望ViT-CoMer能成为密集预测任务的新骨干,以促进未来的研究。”

01

直播信息

时间

2024年3月28日(周四):20:00-21:00


主题

视觉新骨干ViT-CoMer密集预测任务中的应用
直播

B站也将同步进行

http://live.bilibili.com/3344545

02

嘉宾介绍

夏春龙

西安交通大学硕士,现任百度资深算法工程师,交通感知算法负责人,研究方向有交通感知大模型、2&3D检测和轻量化框架设计等。


03

关于分享

➤分享大纲

1、 概念介绍

  • 密集预测

  • 卷积神经网络

  • Transformer

2、 方案动机

  • 现有方案的优缺点

  • 本文方案

3、 方案实现

  • 框架介绍

  • 多感受野特征金字塔(MRFP)

  • CNN-Transformer特征层级交互(CTI)

4、 方案结果

  • 效果

  • 性能

  • 可拓展性

  • 可视化

04

参与方式

05

往期回顾

极市平台专注分享计算机视觉前沿资讯和技术干货,特邀请行业内专业牛人嘉宾为大家分享视觉领域内的干货及经验,目前已成功举办127期线上分享。近期在线分享可点击以下标题查看:


更多往期分享请浏览:极市计算机视觉技术分享集锦

http://bbs.cvmart.net/topics/149/cvshare),也可以点击阅读原文获取。

【声明】内容源于网络
0
0
极市平台
为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
内容 8155
粉丝 0
极市平台 为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
总阅读7.6k
粉丝0
内容8.2k