大数跨境
0
0

极市直播回放第112期丨InternGPT: 基于点击-语言驱动的视觉交互系统

极市直播回放第112期丨InternGPT: 基于点击-语言驱动的视觉交互系统 极市平台
2023-05-19
1
导读:附PPT下载地址
↑ 点击蓝字 关注极市平台

视觉任务中,我们常常需要对不同的图片进行感知和编辑,系统能够精准判断用户的意图非常重要目前大部分工作都是基于纯语言与LLM进行交互,但由于受语言模型以及后端任务推理的能力限制,系统很难精准响应人们的请求。

本次分享我们邀请到了上海人工智能实验研究员刘兆洋,为大家介绍他们的工作:

InternGPT: Solving Vision-Centric Tasks by Interacting with ChatGPT Beyond Language

我们结合指点设备和语言,提出了InternGPT,让视觉交互系统能够更精准地感知用户意图。即使在复杂的场景中,InternGPT也能完成感知、编辑、创作和视觉问答等任务。

后台回复“极市直播”或点击阅读原文即可获取PPT
➤详情传送门

极市直播|让ChatGPT更懂视觉任务!InternGPT: 基于点击-语言驱动的视觉交互系统

论文

InternGPT: Solving Vision-Centric Tasks by Interacting with ChatGPT Beyond Language

论文地址:  https://arxiv.org/pdf/2305.05662.pdf 

代码地址:  https://github.com/OpenGVLab/InternGPT 

在线Demo:https://igpt.opengvlab.com

回放视频在这里☟

https://www.bilibili.com/video/BV14P411d73x/

PPT内容截图(后台回复“极市直播”或点击阅读原文即可获取PPT)

往期视频在线观看
B站:http://space.bilibili.com/85300886#!/
腾讯视频:http://v.qq.com/vplus/8be9a676d97c74ede37163dd964d600c

往期线上分享集锦:http://m6z.cn/6qIJzE(或直接阅读原文

如果觉得有用,就请分享到朋友圈吧!

△点击卡片关注极市平台,获取最新CV干货


推荐阅读

# CV技术社群邀请函 #

△长按添加极市小助手
添加极市小助手微信(ID : cvmart2)

备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳)


即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群


每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~



觉得有用麻烦给个在看啦~  

【声明】内容源于网络
0
0
极市平台
为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
内容 8155
粉丝 0
极市平台 为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
总阅读3.2k
粉丝0
内容8.2k