R-CNN架构

架构

RCCN由三个模块组成：
第一个模块生成与类别无关的区域提议。这些提议定义了我们的检测器可用的候选检测集。

第二个模块是一个大型卷积神经网络，它从每个区域中提取固定长度的特征向量。

第三个模块是一组特定类别的线性支持向量机（SVM）。

虽然R-CNN对特定的区域提议方法不挑剔，但选择性搜索（Selective search）是最常用的方法，以便与之前的检测工作进行有对照的比较。

实现

在测试时，会在图像上进行选择性搜索，以提取大约2000个区域提议。每个提议都会进行变形处理，然后通过卷积神经网络（CNN）前向传播来计算特征。之后，对于每个类别，会使用针对该特定类别训练的支持向量机来评估每个提取的特征向量的得分。在图像内所有得分区域都计算完成后，会应用贪婪非极大值抑制（对每个类别独立进行），如果一个区域与得分更高的选定区域的交并比（IoU）重叠大于预先设定的阈值，那么该区域就会被舍弃。

论文

Rich feature hierarchies for accurate object detection and semantic segmentation 1311.2524

本文由mdnice多平台发布

R-CNN架构

R-CNN架构

架构

实现

论文

柏企科技圈

引用和评论

从CLIP到未来：深入探讨视觉任务的视觉语言模型VLM

Open WebUI：开源AI交互平台的全面解析

大模型中的Token究竟是什么？从原理到作用深度解析

一文掌握 MCP 上下文协议：从理论到实践

MySQL × 向量数据库：大模型时代的黄金组合实战指南

AdventureX 2025 正式启动：五天四夜，120小时极限创造！一起在杭州点燃青年创新之火！

大模型时代，后端程序员如何避免被AI卷死？