注意力模型rpn Model 注意力模型
作者:admin发布时间:2021-12-11分类:传奇私服浏览:161评论:10
学习就是一个建立知识树的过程。网上有很多文章都只是树身上树干上的一个小枝干,所以不能给你建立一个完整的知识体系树。
今天我这篇文章也只是一个小枝干。
我力争让大家能够窥一斑而知全豹。
-rcnn和RA-CNN两篇文章都是在注意力机制上做文章,前一篇是监督式的,后一篇是半监督的。我觉得半监督学习是一个很有意思的事情。
后一篇篇文章的地址在这里:
论文:-
论文链接:
(1)
-rcnn中的RPN。
温故而知新。我还是希望深入浅出的给大家拎一下-rcnn的知识脉络。
1、输入与输出
。输入是规整化1000*600的图片+标注的框,这个规格是参数,你自己可以指定。指定完后,输入的框的坐标自然做放大或缩小。同时把这个扩大缩小的比例记录下来。在输入的DATA层参数里。算法的输出是目标框坐标和框中的物体名称。
2、RPN的功能
。RPN就是根据注意力机制生成候选框的。要讲清楚这个里面的机制,得讲明白两个核心概念:和。
Anchor:经常有人在微信上问我这个究竟是个什么东西,这里我统一白话文似的给大家讲明白。
一张图片经过VGG或者其他什么网络,得到特征图后,这个特征图可能是50*30*512。这个50*30,你可以认为是原图片缩小了20倍,因而这个512维的向量代表的就是原图中20*20这么大小的感受野。
这个特征图后面再接卷积层,一个分支得到的是50*30*(2*9),一个分支得到的是50*30*(4*9),其中9是框的种类个数,2是前景和背景的概率,4是框的坐标。
Anchor机制就是说,他默认你这个2*9这些参数,比如说50*30*18的第一个18,代表的是原图,0-20*0-20这个像素块上的box,前景和后景的概率值。这个像素块的box怎么生成的,你可以看lib/rpn/generate_anchors.py是怎么生成的。
这里有一张图,讲了anchor的生成box问题,他这个图三个尺寸,长宽比分别是1:1,1:2,2:1,这个图这些小框事实上他们的中心坐标应该是重叠的。
已有10位网友发表了看法: