R-CNN、SPP-Net、Fast R-CNN…你都掌握了吗？一文总结目标检测必备经典模型（一）

欢迎关注“

计算机视觉研究院

”

计算机视觉研究院专栏

作者：Edison_G

扫描二维码关注我们

微信公众号 : 计算机视觉研究院

转自《机器之心》

本文将分 3 期进行连载，共介绍 16 个在目标检测任务上曾取得 SOTA 的经典模型。

第 1 期：R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN、OHEM
第 2 期：R-FCN、Mask RCNN、YoLo、SSD、FPN、RetinaNet
第 3 期：RRC detection、CornerNet、M2Det、FOCS、ObjectBox

您正在阅读的是其中的第 1 期。前往 SOTA！模型资源站（sota.jiqizhixin.com）即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。

本期收录模型速览

模型	SOTA！模型资源站收录情况	模型来源论文
R-CNN	https://sota.jiqizhixin.com/project/r-cnn-2 收录实现数量：2 支持框架：MindSpore	Rich feature hierarchies for accurate object detection and semantic segmentation
SPP-Net	https://sota.jiqizhixin.com/project/sppnet 收录实现数量：3 支持框架：PyTorch，MindSpore等	Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
Fast R-CNN	https://sota.jiqizhixin.com/project/fast-rcnn-2 收录实现数量：27 支持框架：PyTorch，TensorFlow等	Fast R-CNN
Faster R-CNN	https://sota.jiqizhixin.com/project/faster-r-cnn-2 收录实现数量：16 支持框架：PyTorch，TensorFlow等	Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
OHEM	https://sota.jiqizhixin.com/project/ohem 收录实现数量：5 支持框架：PyTorch，TensorFlow	Training Region-based Object Detectors with Online Hard Example Mining

本文回顾目标检测中必备的TOP模型，包括one-stage模型和two-stage模型。

一、two-stage模型

图1. R-CNN目标检测系统概览

图2. 一个带有空间金字塔池层的网络结构。这里256是conv5层的过滤器编号，conv5是最后一个卷积层

图3. Fast R-CNN架构。将一个输入图像和多个感兴趣的区域（RoI）输入到一个全卷积网络。每个ROI汇集成一个固定大小的特征图，然后通过全连接层（FCs）映射成一个特征向量。该网络对每个RoI有两个输出向量：softmax概率和每类bounding box回归偏移。该架构采用多任务损失法进行端到端训练

图4. RPN结构

图5. Faster R-CNN是一个用于物体检测的单一、统一的网络。RPN模块作为这个统一网络的 "注意力"

图6. OHEM训练过程，给定一个图像和选择性搜索的RoI，conv网络计算出一个conv特征图。在(a)中，只读RoI网络对特征图和所有RoI（绿色箭头所示）进行前向传递。然后，Hard RoI模块使用这些RoI损失来选择B个样本。在（b）中，这些hard样本被RoI网络用来计算前向和后向传递（红色箭头所示）

© THE END

转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入！

计算机视觉研究院主要涉及深度学习领域，主要致力于人脸检测、人脸识别，多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架，我们这次改革不同点就是，我们要着重”研究“。之后我们会针对相应领域分享实践过程，让大家真正体会摆脱理论的真实场景，培养爱动手编程爱动脑思考的习惯！

扫码关注

计算机视觉研究院

公众号ID｜ComputerVisionGzq

学习群｜扫码在主页获取加入方式

往期推荐

🔗