本次分享我们邀请到了上海交通大学长聘轨副教授谢伟迪,为大家介绍他们的一些探索工作:
OvarNet: Towards Open-vocabulary Object Attribute Recognition
“近年来,基础模型取得了巨大成功。从本质上讲,这些在网络数据上训练的模型已经显示出对大量人类知识的编码。例如,ChatGPT、GPT4能够就大多数主题与人类自由聊天。在这次演讲中,我想介绍我们最近在利用基础模型中的知识方面所做的一些工作,并将现有计算机视觉系统的能力扩展到开放词汇场景,例如动作识别、对象检测、分割、电影音频描述等。
最后,还会讨论我最近对AI4science研究的另一个重点,特别是医学领域的表征学习,这特别需要大量的人类知识参与,例如医学图像分析、疾病预测和临床决策等。”
➤论文
OvarNet: Towards Open-vocabulary Object Attribute Recognition
论文地址:https://arxiv.org/pdf/2301.09506.pdf
➤回放视频在这里☟



往期线上分享集锦:http://m6z.cn/6qIJzE(或直接阅读原文)
如果觉得有用,就请分享到朋友圈吧!
推荐阅读
# CV技术社群邀请函 #
备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳)
即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群
每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~

