单发多框检测(SSD) 讨论区


#84

如果是前者的话,那把scale和ratio应用到每一个layer, 和全部应用到一个layer上计算boxes,有什么区别?请大神指导。。。。。。谢谢


#85

请问沐神,为什么使用MultiboxPrior生成的锚框是就是n+m-1了,那我想生成n*m个怎么办呢?
@mli


#86

我也想问这个问题


#87

请问C++的源码在哪里可以看到呢


#88

主要是image augmentation比较耗费CPU资源

一般都是从imagenet train好的模型开始跑

这样会导致计算量过大。


#89

但是标准的不都是生成n*m个吗。。。。
顺便就是想问下C++的源码要怎么看呢


#90

论文里就是 n+m+1 c++源码在src/operator下吧。


#91

额 难道是我记错了 真实谢谢沐神了 :grinning:


#92

emmmm… 再打扰一下
就是想问下anchor box生成的方式还是不太懂
比如教程中的第一个锚框:
[ 0.26249999 0.26249999 0.76249999 0.76249999]
是怎么计算出来的呢?我按照教程里面给的方式算不出来啊。。


#93

新的问题来了,为什么num_classes要设置为2呢,难道不是就一个类吗。。。


#94

额 我看错了 我真是个智障、。、。


#95

恩,谢谢,这个地方我还需要再检查一下。


#96

用Python im2rec.py生成lst文件时是不是只能生成具有一个标签的lst,不适用于生成具有多个标签的lst文件?如果是的话,怎样生成具有多个标签的lst文件用于图像检测呢?


#97


hello 小弟剛完成這份

希望有幫忙到你


#98

就是对类0预测值排序,选取数值最小的哪一些困难的负类锚框
请问MultiboxTarget中哪里是体现上面这句话的思想的呢? @mli


#99

SSD这地方还有好多不懂,跪求大佬解答下!
例如本代码教程中皮卡丘所代表的类别编号到底是0还是1
首先原始的idx文件中是0
而multiboxtarget输出的box_target看样子又是1
最后multiboxdetection输出的又是0

为什么要这样设计呢?
还是我哪里理解的有问题呢?

还有一个建议就是下次还是找个多类别的物体检测问题,只有一类的话感觉还是影响理解。。。


#100

x, im = process_image(’…/img/pikachu.jpg’)这个的图片是在哪里找啊?


#101


here


#102

0是background


#103

请问一下:
假如一张img ,生成了1000个锚点框,然后该img有6个label。
在计算 锚点框的 loss时,是和6个label分别计算一次loss然后取loss最小的么?