干货｜YOLOV3源码解读- 大数跨境

首页

干货｜YOLOV3源码解读

瓦特和比特

2018-12-28

导读：文章题目比较大，源码解读是一项很庞大的工程，本文只是一个引子。小编也希望借写文章的机会，好好读一下代码，真正

文章题目比较大，源码解读是一项很庞大的工程，本文只是一个引子。小编也希望借写文章的机会，好好读一下代码，真正了解原理，并与读者一起讨论学习，接受批评。

读文章前，不妨看一下YOLOV3检测效果的视频～～

YOLOv3 效果展示

怎么样，够惊艳吧！是不是更想深入了解了呢！

YOLOV3是什么？

计算机视觉领域主要有图像分类、图像定位、目标检测、目标跟踪等几大任务。图像分类模型是将图像划分为单个类别，通常对应于图像中最突出的物体。图像定位是在图像分类的基础上，确定目标具体在图像的什么位置；目标检测是从图像中输出单个目标的Bounding Box（边框）以及标签。

在图像定位中，通常只有一个或固定数目的目标，而目标检测更一般化，图像中出现的目标种类和数目都不确定；目标跟踪是指在给定场景中跟踪感兴趣的具体对象或多个对象的过程，简单来说，给出目标在跟踪视频第一帧中的初始状态（如位置、尺寸），自动估计目标物体在后续帧中的状态。

YOLO 是Joseph Redmon，Santosh Divvala，Ross Girshick和Ali Farhadi提出的一种目标检测算法。人类视觉系统快速且精准，只需看一眼就可以识别图像的物体和位置，因此，作者用YOLO（You Only Look Once）命名其算法，将图像分类和目标定位合二为一。

目标检测技术可在很多场景应用，如无人驾驶、变电站机器人巡检、线路无人机巡检等。

YOLO算法目前已有3个版本，在速度和精确度上都得到巨大提升，小编喜欢一步到位（好高骛远），所以以最新的YOLOV3版本进行分析。其源码可从 https://github.com/pjreddie/darknet 下载。

YOLOV3的优势

目标检测领域有非常多优秀的算法，比如基于候选区域的目标检测器，包括Fast R-CNN、Faster R-CNN 和 FPN等，以及包括YOLO、SSD和RetinaNet等在内的单次检测器。

YOLOV3性能指标如何呢？可以从准确率和检测速度两方面来衡量。“YOLOv3非常快速和准确。在IoU设为0.5时测定mAP，YOUOv3与Focal Loss相当，但速度快了约4倍。而且只需更改模型的大小，您就可以轻松地在速度和精度之间进行平衡！”，如官方图。

可以看出，对于 320x320 的图像，YOLOv3 可以达到22ms的检测速度，与 SSD 的准确率相当，速度却快 3 倍。YOLOv3在一块 TitanX 上可以 51ms 的速度达到57.9 AP_50 的性能，而用 RetinaNet 则以 198ms 的速度获得 57.5 AP_50 的性能，性能相近但快3 倍。

从前面视频也可以看到，YOLOV3对小物体或远处物体、重叠遮挡物体、运动模糊物体、密集物体的识别率都非常高。

使用YOLO进行目标检测

1 使用预训练模型

使用预先训练的模型通过YOLO系统检测对象，如果没有安装Darknet，那么应该首先安装Darknet。