注意力模型rpn Model 注意力模型

作者：admin发布时间：2021-12-11分类：传奇私服浏览：161评论：10

导读：学习就是一个建立知识树的过程。网上有很多文章都只是树身上树干上的一个小枝干，所以不能给你建立一个完整的知识体系树。今天我这篇文章也只是一个小枝干。我力争让大家能够窥一斑而知全豹。-...

学习就是一个建立知识树的过程。网上有很多文章都只是树身上树干上的一个小枝干，所以不能给你建立一个完整的知识体系树。

我力争让大家能够窥一斑而知全豹。

-rcnn和RA-CNN两篇文章都是在注意力机制上做文章，前一篇是监督式的，后一篇是半监督的。我觉得半监督学习是一个很有意思的事情。

论文：-

论文链接：

(1)

温故而知新。我还是希望深入浅出的给大家拎一下-rcnn的知识脉络。

1、输入与输出

。输入是规整化1000*600的图片+标注的框，这个规格是参数，你自己可以指定。指定完后，输入的框的坐标自然做放大或缩小。同时把这个扩大缩小的比例记录下来。在输入的DATA层参数里。算法的输出是目标框坐标和框中的物体名称。

。RPN就是根据注意力机制生成候选框的。要讲清楚这个里面的机制，得讲明白两个核心概念：和。

Anchor：经常有人在微信上问我这个究竟是个什么东西，这里我统一白话文似的给大家讲明白。

一张图片经过VGG或者其他什么网络，得到特征图后，这个特征图可能是50*30*512。这个50*30,你可以认为是原图片缩小了20倍，因而这个512维的向量代表的就是原图中20*20这么大小的感受野。

这个特征图后面再接卷积层，一个分支得到的是50*30*（2*9），一个分支得到的是50*30*（4*9），其中9是框的种类个数，2是前景和背景的概率，4是框的坐标。

Anchor机制就是说，他默认你这个2*9这些参数，比如说50*30*18的第一个18，代表的是原图,0-20*0-20这个像素块上的box,前景和后景的概率值。这个像素块的box怎么生成的，你可以看lib/rpn/generate_anchors.py是怎么生成的。

这里有一张图，讲了anchor的生成box问题，他这个图三个尺寸，长宽比分别是1:1,1:2,2:1,这个图这些小框事实上他们的中心坐标应该是重叠的。

相关推荐