单发多框检测(SSD) 讨论区


#41

使用pycharm运行mxnet代码,程序在执行完后,pycharm的依然显示没有执行完毕(红色的方块按钮依然是红色的,后台进程显示python依然在运行),但是如果使用numpy代码或其他python代码都没有这个问题,请大神指教这是怎么回事?


#42

ssd中,在预测物体类别时,使用了3x3的卷积.
为什么要使用3x3的卷积?而不是1x1或5x5?
还是说3x3卷积是考虑了某个像素及其周边的?
同样的问题在边界框预测中也存在.

跪请大神指点!


#43

终于把自己的数据集做了出来,发现这样设置会出现问题,提示如下:
‘’‘Attempts to reduce label count from 10 to 3, not allowed.‘’‘

所以通过im2rec制作数据的时候,脚本应该是根据lst中标签数量最多的一条数据来决定上限了。


#45

请问,为什么我在运行ssd这个代码时会遇到这个问题:


#46

我也遇到了这个问题,改成
print(‘Epoch %2d, train %s %.2f, %s %.5f, time %.1f sec’ % (epoch, cls_metric.get()[0],cls_metric.get()[1],box_metric.get()[0],box_metric.get()[1], time.time()-tic))后没问题了。但是应该如何直接分解并循环调用tuple里面的元素呢?


SSD 教程代码报错问题..
#47

谢谢。我也发现它是个tuple了,不知道为什么沐神的写法为什么不行 :thinking:


#48

给定大小 s∈(0,1],那么生成的边界框形状是 ws×hs
这一句话,如果size是0.9,ratio是1,输入300x300的话,锚框形状就是300x0.9 ,270x270? 还是w h应该是每个对应feature map的w h?


#49

是前者哦


#50

feature map如果是8x8的话,其实就是把输入图像分成8x8个格子 这个理解正确吗?


#51

想请问一下im2rec.py那个文件该怎么用,带坐标的不知道该如何打包。


#52

只是针对vgg模型的norm,其他自带batchnorm的网络不需要额外加


#53

https://discuss.gluon.ai/t/topic/3018


#55

min_crop_overlaps (tuple of , optional, default=[0]) – Augmentation Param: Minimum crop IOU between crop_box and ground-truths.
这个参数怎么理解? 是指crop出来的区域,跟每个ground truch算iou,都得大于这个值吗? 最后crop出来的图,得过crop_emit_mode ,如果失败,crop_trials +1


#57

有3个问题,望解答:
1.示例代码中 train_data.reshape(label_shape=(3, 5)) #假如图片是只有一个物体,那是把框的信息复制3遍还是添加2个类别信息为-1的框
2.train_data = test_data.sync_label_shape(train_data) #这句代码作用是?
3.评估边框预测时box_metric.update([box_target], [box_preds * box_mask])感觉不对吧,不应该是box_metric.update([box_target * box_mask], [box_preds * box_mask])嘛


#58

第一个问题,测了一下,缺多少个,填充的多少[-1,-1,-1,-1,-1]


#59

为什么im2rec的教程还没有加上?请制作一下怎么制作目标检测数据集的方法吧,不是早就说了做了么?


#60

为了计算简单这里不生成m*n个锚框,而是n+m−1个

请问,这个地方有试验过对性能的影响没?
如果有一定的影响,建议改成可调的形式


#61

n*m 很可能跑不动了


#62

如果用n*m的话,需要怎么修改MultiBoxPrior


#63

@mli 你好,我有2个问题一直无法解决:

  1. 在代码中,toy_ssd_forward函数中anchors是由MultiBoxPrior函数生成的,是0到1之间的多维数组。那么怎么进行训练呢? 代码中两个predictor都没有用到anchors中的数据。

  2. 我理解的是,图片通过covn后,对feature map进行生成anchors操作,然后将生成后的结果交给predictor不知道是不是如此。如果是,那么就是第1个问题,如果不是,如果可能的话,帮忙点化一下。

谢谢