大数跨境
0
0

极市直播预告|大模型时代目标检测的三点尝试

极市直播预告|大模型时代目标检测的三点尝试 极市平台
2023-07-31
0
导读:本周四晚九点,不见不散!
↑ 点击蓝字 关注极市平台

|极市线上分享第118期 |

一直以来,为让大家更好地了解学界业界优秀的论文和工作,极市已邀请了超过100位技术大咖嘉宾,并完成了117 期极市线上直播分享。

往期分享请前往bbs.cvmart.net/topics/149或直接阅读原文,也欢迎各位小伙伴自荐或推荐更多优秀的技术嘉宾到极市进行技术分享,与大家一起交流学习~~

本次分享我们邀请到了香港大学的博士生孙培泽,为大家介绍他们的一些探索工作:
Learning Object-Language Alignments for Open-Vocabulary Object Detection(ICLR2023)
Going Denser with Open-Vocabulary Part Segmentation(ICCV2023)
Semantic-SAM: Segment and Recognize Anything at Any Granularity.
GPT4RoI: Instruction Tuning Large Language Model on Region-of-Interest

01

直播信息

时间

2023年8月3日(周四):21:00-22:00


主题

大模型时代目标检测的三点尝试
直播

B站也将同步进行

http://live.bilibili.com/3344545

02

嘉宾介绍

孙培泽

香港大学博士生,指导老师为罗平副教授。研究方向为计算机视觉和深度学习,包括目标检测分割追踪和视觉语言多模态模型。


03

关于分享

➤分享大纲

1.回顾目标检测的发展历程

2.目标检测的三点尝试

   - 从封闭环境到开放世界

   - 从单一模型到交互系统

   - 从视觉感知到多模态推理

3. 目标检测的新展望:多模态大模型

论文

Learning Object-Language Alignments for Open-Vocabulary Object Detection(ICLR2023)
论文地址:https://openreview.net/pdf?id=mjHlitXvReu
项目地址:https://github.com/clin1223/VLDet
Going Denser with Open-Vocabulary Part Segmentation(ICCV2023)
论文地址:https://arxiv.org/abs/2305.11173
项目地址:https://github.com/facebookresearch/VLPart
Semantic-SAM: Segment and Recognize Anything at Any Granularity
论文地址:https://arxiv.org/abs/2307.04767
项目地址:https://github.com/UX-Decoder/Semantic-SAM
GPT4RoI: Instruction Tuning Large Language Model on Region-of-Interest
论文地址:https://arxiv.org/abs/2307.03601
项目地址:https://github.com/jshilong/GPT4RoI

04

参与方式

05

往期回顾

极市平台专注分享计算机视觉前沿资讯和技术干货,特邀请行业内专业牛人嘉宾为大家分享视觉领域内的干货及经验,目前已成功举办117期线上分享。近期在线分享可点击以下标题查看:


更多往期分享请浏览:极市计算机视觉技术分享集锦

http://bbs.cvmart.net/topics/149/cvshare),也可以点击阅读原文获取。

【声明】内容源于网络
0
0
极市平台
为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
内容 8155
粉丝 0
极市平台 为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
总阅读197
粉丝0
内容8.2k