DL物体检测之-Fast RCNN

"Object Detection Method: Fast RCNN"

Posted by FinlayLiu on November 30, 2017

论文介绍

Fast RCNN也是来自RBG大神,也是对物体检测流程的改进,基于RCNN和SPP-Net的基础。Fast RCNN借鉴了SPP-Net的思路,简化了从proposal提取特征的次数,也对检测流程进行了改进。由于SPP-Net的精度和RCNN旗鼓相当,因此Fast RCNN很大篇幅介绍了提升的精度来自什么操作,也做了一系列实验。

论文内容

论文针对SPP-Net和RCNN的检测流程进行改进,利用SPP-Net的思路对检测流程进行缩减。先提取proposal,然后通过整张图的CNN特征,得到目标边框特征。

Fast RCNN在确定物体类别上,并没有使用之前的SVM训练,而是使用了全连接FC层,并加入了边框位置的回归训练,进一步提高了性能和精度。作者还针对具体的网络结构以及具体的训练方法进行了分别实验比较,证明分类loss和边框回归loss是有效的。

论文创新点和问题

RBG对于物体检测的流程非常熟悉,论文对流程的改进也是基于大量实验基础的:

  • 需要fine-tune那些层?
  • 分类loss和位置loss是分来训练还是一起训练?
  • proposal提取个数多少个?

以上的一些问题,在论文中都通过了具体的实验进行比较。

论文评价

Fast RCNN为之后的物体检测提供了新的发展思路,同时也为具体的发展思路。如果要进一步缩短检测速度,就需要缩短分布流程,采用end2end的训练方法;如果要进一步提高精度,则需要进一步对proposal位置和CNN特征进行进行提高。