《You Only Look Once: Unified, Real-Time Object Detection》——YOLO
目前,基于深度学习算法的一系列目标检测算法大致可以分为两个流派:
- 两步走(two-stage)算法:先生产候选区域然后再进行CNN分类(RCNN系列)
- 一步走(one-stage)算法:直接对输入图像应用算法并输出类别和相应的定位(YOLO系列)
之前的R-CNN系列虽然准确率比较高,但是即使是发展到Faster R-CNN,检测一张图片如下图所示也要7pfd(原文为5fps),为了使得检测的工作能够应用到实时的场景中,提出了YOLO
WOLO的检测思想不同于R-CNN系列的思想,它将目标检测作为回归任务来解决。
YOLO的整体结构: