扫描二维码 关注我们
微信公众号 : 计算机视觉研究院
转自《机器之心》
本文将分 3 期进行连载,共介绍 16 个在目标检测任务上曾取得 SOTA 的经典模型。
-
第 1 期:R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN、OHEM
-
第 2 期:R-FCN、Mask RCNN、YoLo、SSD、FPN、RetinaNet
-
第 3 期:RRC detection、CornerNet、M2Det、FOCS、ObjectBox
您正在阅读的是其中的第 1 期。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。
模型 | SOTA!模型资源站收录情况 | 模型来源论文 |
---|---|---|
R-CNN |
https://sota.jiqizhixin.com/project/r-cnn-2 收录实现数量:2 支持框架:MindSpore |
Rich feature hierarchies for accurate object detection and semantic segmentation |
SPP-Net |
https://sota.jiqizhixin.com/project/sppnet 收录实现数量:3 支持框架:PyTorch,MindSpore等 |
Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition |
Fast R-CNN |
https://sota.jiqizhixin.com/project/fast-rcnn-2 收录实现数量:27 支持框架:PyTorch,TensorFlow等 |
Fast R-CNN |
Faster R-CNN |
https://sota.jiqizhixin.com/project/faster-r-cnn-2 收录实现数量:16 支持框架:PyTorch,TensorFlow等 |
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks |
OHEM |
https://sota.jiqizhixin.com/project/ohem 收录实现数量:5 支持框架:PyTorch,TensorFlow |
Training Region-based Object Detectors with Online Hard Example Mining |
本文回顾目标检测中必备的TOP模型,包括one-stage模型和two-stage模型。
一、two-stage模型
图1. R-CNN目标检测系统概览
图2. 一个带有空间金字塔池层的网络结构。这里256是conv5层的过滤器编号,conv5是最后一个卷积层
图3. Fast R-CNN架构。将一个输入图像和多个感兴趣的区域(RoI)输入到一个全卷积网络。每个ROI汇集成一个固定大小的特征图,然后通过全连接层(FCs)映射成一个特征向量。该网络对每个RoI有两个输出向量:softmax概率和每类bounding box回归偏移。该架构采用多任务损失法进行端到端训练
图4. RPN结构
图5. Faster R-CNN是一个用于物体检测的单一、统一的网络。RPN模块作为这个统一网络的 "注意力"
图6. OHEM训练过程,给定一个图像和选择性搜索的RoI,conv网络计算出一个conv特征图。在(a)中,只读RoI网络对特征图和所有RoI(绿色箭头所示)进行前向传递。然后,Hard RoI模块使用这些RoI损失来选择B个样本。在(b)中,这些hard样本被RoI网络用来计算前向和后向传递(红色箭头所示)
转载请联系本公众号获得授权
计算机视觉研究院学习群等你加入!
扫码关注
计算机视觉研究院
公众号ID|ComputerVisionGzq
学习群|扫码在主页获取加入方式
往期推荐
🔗
-
ICCV2021涨点神器:新方式在视觉类领域提升精度(附源代码)
-
ResNet超强变体:京东AI新开源的计算机视觉模块!(附源代码)
-
YOLOS:通过目标检测重新思考Transformer(附源代码)
-
自己觉得挺有意思的目标检测框架,分享给大家(源码论文都有)
-
CVPR2021:IoU优化——在Anchor-Free中提升目标检测精度(附源码)
-
多尺度深度特征(上):多尺度特征学习才是目标检测精髓(干货满满,建议收藏)
-
多尺度深度特征(下):多尺度特征学习才是目标检测精髓(论文免费下载)
-
ICCV2021目标检测:用图特征金字塔提升精度(附论文下载)
-
CVPR21小样本检测:蒸馏&上下文助力小样本检测(代码已开源)
本文来自微信公众号“计算机视觉研究院”(ID:ComputerVisionGzq)。大作社经授权转载,该文观点仅代表作者本人,大作社平台仅提供信息存储空间服务。