

极市直播回放第117期丨知识驱动的多模态表征学习

极市平台

2023-07-26

导读：附PPT下载地址

↑ 点击蓝字关注极市平台

本次分享我们邀请到了上海交通大学长聘轨副教授谢伟迪，为大家介绍他们的一些探索工作：

OvarNet: Towards Open-vocabulary Object Attribute Recognition

“近年来，基础模型取得了巨大成功。从本质上讲，这些在网络数据上训练的模型已经显示出对大量人类知识的编码。例如，ChatGPT、GPT4能够就大多数主题与人类自由聊天。在这次演讲中，我想介绍我们最近在利用基础模型中的知识方面所做的一些工作，并将现有计算机视觉系统的能力扩展到开放词汇场景，例如动作识别、对象检测、分割、电影音频描述等。

最后，还会讨论我最近对AI4science研究的另一个重点，特别是医学领域的表征学习，这特别需要大量的人类知识参与，例如医学图像分析、疾病预测和临床决策等。”

后台回复“极市直播”或点击阅读原文即可获取PPT

➤详情传送门

极市直播预告｜CVPR23-OvarNet：开集预测的新SOTA，“万物识别”有了新玩法

➤论文

OvarNet: Towards Open-vocabulary Object Attribute Recognition

论文地址：https://arxiv.org/pdf/2301.09506.pdf

➤回放视频在这里☟

https://www.bilibili.com/video/BV1AV4y1t7LU/

➤PPT内容截图（后台回复“极市直播”或点击阅读原文即可获取PPT）