RCNN简介

网络结构

1.png

算法介绍

  1. 训练分类网络 (AlexNet)
  2. 模型做 fine-tuning
    • 类别1000改为20
    • 去掉FC
  3. 特征提取
    • 提取候选框(选择性搜索)
      • 一:生成区域集R
      • 二:计算区域集R里每两个相邻区域的相似度S={s1,s2,…}
      • 三:找出相似度最高的两个区域,将其合并为新集,添加进R
      • 四:从S中移除所有与第三步中有关的子集
      • 五:计算新集与所有子集的相似度
      • 六:跳至第三步,直至S为空
    • 对于每一个区域:修正区域为CNN的输入,利用网络对候选框提取特征
  4. 训练 SVM 分类器,每个类别对应一个 SVM
  5. 回归器精修候选框位置:利用线性回归模型判定框的准确度

RCNN缺点

  1. 候选框选择算法耗时严重
  2. 重叠区域特征重复计算
  3. 分步骤进行,过程繁琐

参考文献

论文地址

RCNN 详解