
极市导读
本文为ECV2022竞赛获得户外违规广告牌识别的冠军方案分享,作者团队简要分享了他们的比赛思路。 >>【极市平台 x VALSE2022 CV开发者之夜】非正式交流晚宴向您发出邀请!🌟🌟🌟来现场朋友请戳此报名:https://sourl.cn/eiRQ84
一、赛题回顾
白银榜-户外违规广告牌识别
本赛题希望基于计算机视觉技术可以实时检测到“户外广告牌”,能够及时的管理户外广告牌,实现智能化,为管理人员减轻负担。赛题的目标是使用计算机视觉算法对图片中的广告牌进行识别。
比赛的评价指标由F1 score和性能分FPS组成,这要求算法设计要兼顾精度和速度,算法的推理性能要具备实时性。
说明:
(1)算法性能指的赛道标准值是 80 FPS, 如果所得性能值FPS≥赛道标准值FPS,则算法性能值得分=10;
(2) 本题规定predicted bounding box和ground truth bounding box的IoU(交叉比)作为结果目标匹配的依据,其中IoU值>0.5且目标类别标签相匹配的目标视为正确结果,其它视为正确结果,其它视为错误。
本赛题主要难点如下:
1、采集自摄像头的图片存在分辨率低,对比对低,环境光污染等问题。
2、目标在图像中分布密集,并且遮挡严重。
3、人工标注存在错标,漏标,标准不一等问题(如遮挡严重的广告牌)。
4、实时性要求高。

二、主要工作
1、主体框架选择
目前,基于深度学习的目标检测技术包括anchor-based和anchor-free两大类。首先我们先是分析两者的优缺点:
anchor-based:
1)优点:加入了先验知识,模型训练相对稳定;密集的anchor box可有效提高召回率,对于小目标检测来说提升非常明显。
2)缺点:对于多类别目标检测,超参数scale和aspect ratio相对难设计;冗余box非常多,可能会造成正负样本失衡;在进行目标类别分类时,超参IOU阈值需根据任务情况调整。
anchor-free:
1)优点:计算量减少;可灵活使用。
2)缺点:存在正负样本严重不平衡;两个目标中心重叠的情况下,造成语义模糊性;检测结果相对不稳定。
我们又考虑到比赛任务情况:
1)比赛数据中存在很多目标遮挡情况,这有可能会造成目标中心重合,如果采用anchor-free,会造成语义模糊性;
2)scale和aspect ratio可控,那么超参IOU调整相对简单;
3)大赛对模型部署没有特殊要求,因此,部署方案相对较多,模型性能有很大改进。
因此,在anchor-based和anchor-free两者中,我们偏向于选择基于anchor-based的算法。
众所周知,YOLO系列性能在目标检测算法一直引人瞩目,特别是最近的YOLOv5在速度上更是令人惊讶。从下图可以看出,YOLOv5在模型大小方面选择灵活,训练周期相对较短。另外,在保证速度的同时,模型精度也是可观。因此,我们选用YOLOv5作为baseline,然后依据赛道的任务情况在此基础上进行改进。
另外,要权衡检测分类的精度和模型运行的速度,因此我们决定选用检测分类精度较好的。
1、目标检测框架:基于YOLOv5的one-stage检测框架
2、模型优化:采用优化策略,比如数据增强、Focal Loss
3、模型加速:tensorrt
数增强策略
从数据角度,我们通过mosaic、仿射变换等对样本进行增强,增加目标多样性,以提升模型的检测与分类精度。
Focal Loss
目前YOLOv5采用的 GIOU虽然考虑了边界框回归的重叠面积、中心点距离、纵横比。反映的纵横比的差异,而不是宽高分别与其置信度的真实差异,所以有时会阻碍模型有效的优化相似性。为了加速了收敛提高了回归精度,使得回归过程专注于高质量锚框,将GIOU替换为EIOU。

实验结果
在精度方面完整的训练yolov5l后 可以在实战榜中达到94左右的F1-score,但是未经过加速的性能分仅为27,经过tensorrt会加速后性能分刚好能够达到80满足性能分最高分。
三、团队介绍
团队来自广西师范大学计算机科学与工程学院钟必能教授实验室。团队成员为:胡现韬、徐辰龙、张光瞳、容一民和邢卧龙。
公众号后台回复“极市直播”获取极市直播第100期(视频实例分割新SOTA:SeqFormer&IDOL)PPT下载~

“
点击阅读原文进入CV社区
收获更多技术干货

