大数跨境
0
0

极市直播预告|让ChatGPT更懂视觉任务!InternGPT: 基于点击-语言驱动的视觉交互系统

极市直播预告|让ChatGPT更懂视觉任务!InternGPT: 基于点击-语言驱动的视觉交互系统 极市平台
2023-05-17
2
导读:本周四晚八点,不见不散!
↑ 点击蓝字 关注极市平台

|极市线上分享第112期 |

一直以来,为让大家更好地了解学界业界优秀的论文和工作,极市已邀请了超过100位技术大咖嘉宾,并完成了111期极市线上直播分享。

往期分享请前往bbs.cvmart.net/topics/149或直接阅读原文,也欢迎各位小伙伴自荐或推荐更多优秀的技术嘉宾到极市进行技术分享,与大家一起交流学习~~

视觉任务中,我们常常需要对不同的图片进行感知和编辑,系统能够精准判断用户的意图非常重要目前大部分工作都是基于纯语言与LLM进行交互,但由于受语言模型以及后端任务推理的能力限制,系统很难精准响应人们的请求。
本次分享我们邀请到了上海人工智能实验研究员刘兆洋,为大家介绍他们的工作:
InternGPT: Solving Vision-Centric Tasks by Interacting with ChatGPT Beyond Language
我们结合指点设备和语言,提出了InternGPT,让视觉交互系统能够更精准地感知用户意图。即使在复杂的场景中,InternGPT也能完成感知、编辑、创作和视觉问答等任务。

01

直播信息

时间

2023年5月18日(周四):20:00-21:00


主题

InternGPT: 基于点击-语言驱动的视觉交互系统

02

嘉宾介绍

刘兆洋

南京大学硕士研究生毕业,现兼职上海人工智能实验研究员。研究方向为计算机视觉,包括视频理解以及多模态等。更多信息见Google Scholar主页:
https://scholar.google.com/citations?user=btgwZosAAAAJ&hl=en


03

关于分享

➤分享大纲

1、语言驱动的视觉交互系统进展

2、InternGPT框架简介

3、InternGPT功能介绍

4、Demo展示

5、未来展望

论文

InternGPT: Solving Vision-Centric Tasks by Interacting with ChatGPT Beyond Language

论文地址:  https://arxiv.org/pdf/2305.05662.pdf 

代码地址:  https://github.com/OpenGVLab/InternGPT 

在线Demo:https://igpt.opengvlab.com

04

参与方式

B站也将同步进行

http://live.bilibili.com/3344545


04

往期回顾

极市平台专注分享计算机视觉前沿资讯和技术干货,特邀请行业内专业牛人嘉宾为大家分享视觉领域内的干货及经验,目前已成功举办111期线上分享。近期在线分享可点击以下标题查看:


更多往期分享请浏览:极市计算机视觉技术分享集锦

http://bbs.cvmart.net/topics/149/cvshare),也可以点击阅读原文获取。

【声明】内容源于网络
0
0
极市平台
为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
内容 8155
粉丝 0
极市平台 为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
总阅读5.7k
粉丝0
内容8.2k