课时10 目标检测原理与应用(中)
怎么实现物体检测
物体检测:搜索+分类
传统检测方法:
滑动窗,提取窗口内的部分进行物体检测。
框的大小固定,将图像resize为各种大小的图片集合(图像金字塔),使得框内的部分大小变化,从而实现用固定大小的框检测不同大小的物体
传统方法
论文1 Robust Real-Time Face Detection
使用了滑动窗+图像金字塔
Haar特征,用白框的像素值减去灰框中的像素值,得到的结果是该区域的Haar特征值
级联分类器
论文2 Deformable Part Models----------
特征HOG
分类器SVM
深度学习方法
论文1 R-CNN-------------------
传统方法与神经网络结合,使用传统方法生成候选区域,resize后,送入CNN分类。
主要贡献:用CNN取代了原来的特征提取和分类器。
论文2 Fast RCNN-------------------
RCNN的问题是会重复计算。
FastRCNN将图片送入CNN,得到特征图,
使用了ROI pooling,转为固定尺寸的大小
主要贡献:避免了相同区域的特征重复提取
论文3 Faster RCNN-------------------
引入了RPN结构
论文4 R-FCN------------------
论文5 YOLO-------------------
对一张图片直接计算回归,得到bb的位置和类别
论文6 SSD-------------------
可以看做强化版的RPN
用不同阶段的特征图进行预测,所以可以检测不同尺度的物体。
论文7 FPN-------------------
多尺度检测
将深层的特征图与浅层的特征图相加,提升表达能力。
论文8 Mask RCNN-------------------
论文9 Focal Loss-------------------
one stage准确率低于two stage的原因:
样本不均衡,负样本太多