R-CNN架构

架构

RCCN由三个模块组成:
第一个模块生成与类别无关的区域提议。这些提议定义了我们的检测器可用的候选检测集。

第二个模块是一个大型卷积神经网络,它从每个区域中提取固定长度的特征向量。

第三个模块是一组特定类别的线性支持向量机(SVM)。

虽然R-CNN对特定的区域提议方法不挑剔,但选择性搜索(Selective search)是最常用的方法,以便与之前的检测工作进行有对照的比较。

实现

在测试时,会在图像上进行选择性搜索,以提取大约2000个区域提议。每个提议都会进行变形处理,然后通过卷积神经网络(CNN)前向传播来计算特征。之后,对于每个类别,会使用针对该特定类别训练的支持向量机来评估每个提取的特征向量的得分。在图像内所有得分区域都计算完成后,会应用贪婪非极大值抑制(对每个类别独立进行),如果一个区域与得分更高的选定区域的交并比(IoU)重叠大于预先设定的阈值,那么该区域就会被舍弃。

论文

Rich feature hierarchies for accurate object detection and semantic segmentation 1311.2524

本文由mdnice多平台发布


柏企科技圈
15 声望4 粉丝