单发多框检测(SSD) 讨论区


#1

http://zh.diveintodeeplearning.org/chapter_computer-vision/ssd.html


于置顶 #2

#3

请问ROIPooling里面的spatial_scale参数怎么理解啊?


#4

就是feature map的长宽和原始图片大小的比率,不过哥们你走错区了,这个是有关fast RCNN的


#5

脚一滑就走错了:joy:,如果我对特征图做ROI,如果特征图相对原始输入已经从100x100变为了10x10,那请问这个spatial_scale参数是不是要设置成10呢?


#6

请问 mask rcnn有相关实现吗


#7

有。。图森未来的实现


#8

多谢了:grinning:


#9

是0.1


#10

多谢!!


#11

突然想起来,如果按照教程的内容把数据打包之后是不是就不能进行图片增强了?
如果是这样的话,看来只能是把处理后的图片和修正的标记保存成新的数据,然而再和原来的数据一起打包。


#12

这里的i<=n是不是应该改成i<=n-1以及后面的i-n和n?


#13

国内下载很慢,请问怎么改地址?


#14

跑着跑着就python已停止工作,这怎么解决?


#15

安装教程里有使用中文源的选项 http://zh.gluon.ai/chapter_prerequisite/install.html


#16

建议新开个帖子把环境和例子发一下


#17

好的,已发


#18

对不起,问的是 SSD 这个课程里 皮卡丘 数据下载 很慢的问题,不过已经下载好了,多谢多谢


#19

每个像素点对应多个大小不同的框,为什么用3X3的卷积就可以了?这么小的卷积核,每个像素点只能覆盖3x3的区域,那要那么多anchor有什么用,大的框,用这么小的卷积盖不住啊?


#20

特征图里的每个像素对应于原图中的n个像素了,这就是每个像素的感受野,所以3x3的卷积对应的覆盖区域,在原图上不只是3x3的区域。