时序动作检测(TAD)任务的目标是从一个未被裁剪的视频中检测出所有动作的类别和起终点。但是由于视频动作的边界往往具有模糊性,因此如何更精准地定位动作边界仍然是一个未被解决的问题。此外,在TAD的任务实践中,基于时间维度的attention的方法往往没有表现出像其他领域一样显著的提升,反而pipeline的设计更加重要。Attention机制为何难以捕获到动作的时序信息,也是一个值得关注的问题。
本次分享我们邀请到了北京航空航天大学博士生石鼎丰,为大家介绍他们CVPR 2023上的工作:
TriDet: Temporal Action Detection with Relative Boundary Modeling
极市直播|CVPR2023-石鼎丰:高效时序动作检测网络TriDet
➤论文
论文地址:https://arxiv.org/abs/2303.07347
代码地址:https://github.com/dingfengshi/TriDet
➤回放视频在这里☟



往期线上分享集锦:http://m6z.cn/6qIJzE(或直接阅读原文)
如果觉得有用,就请分享到朋友圈吧!
推荐阅读
# CV技术社群邀请函 #
备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳)
即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群
每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~

