单发多框检测(SSD) 讨论区


#64

anchors是在训练的时候丢给loss用的


#65

国内根本下载不了数据呀。。。。肿么办???
Downloading …/data/pikachu/train.rec from https://apache-mxnet.s3-accelerate.amazonaws.com/gluon/dataset/pikachu/train.rec

SysCallError Traceback (most recent call last)
G:\Anaconda3-5.0.1\lib\site-packages\urllib3\contrib\pyopenssl.py in recv_into(self, *args, **kwargs)
279 try:
–> 280 return self.connection.recv_into(*args, **kwargs)
281 except OpenSSL.SSL.SysCallError as e:

G:\Anaconda3-5.0.1\lib\site-packages\OpenSSL\SSL.py in recv_into(self, buffer, nbytes, flags)
1624 result = _lib.SSL_read(self._ssl, buf, nbytes)
-> 1625 self._raise_ssl_error(self._ssl, result)
1626


#66


这个是 MultiBoxPrior的CPU实现.
这里应该直接跳过了 ratios[0].
sizes作为变数时, ratio默认等于1.
所以在你这里不会生成长方形.


#67

启动jupyter notebook时用:
MXNET_GLUON_REPO=https://apache-mxnet.s3.cn-north-1.amazonaws.com.cn/ jupyter notebook


#68

为什么mxnet的SSD例子中的vgg称为vgg_reduced, 对比文章的结构图,我发现只是全连接层改变了,并没有减少层数。请问为什么称为vgg_reduced?


#69

ssd模型中的box_predictor 返回的是对锚框变换方式,但好像模型中直接把这个当成了预测出的边框位置,并没有和锚框结合起来其。也有可能是我没看到这段代码,非常感谢大家的提示~


#70

其实可以叫vgg_atrous,只是为了区别原始vgg


#71

谢谢回复,那就是说conv1到conv5没有改变,只是改变了fc6和fc7层,可以这样理解吗


#72

对,fc6和fc7改成了conv,fc6还加了dilate


#73

我正在跑ssd, mxnet训练完一个epoch后保存完checkpoint,报错src/operator/nn/./…/tensor/…/elemwise_op_common.h:123: Check failed: assign(&dattr, (*vec)[i]) Incompatible attr in node at 0-th output: expected [4,709,5], got [4,1968,5], 请问这个是什么原因,谢谢回复


#74

另外随机会报这个错误/home/travis/build/dmlc/mxnet-distro/mxnet-build/dmlc-core/include/dmlc/logging.h:308: [20:53:46] src/engine/./threaded_engine.h:359: [20:53:46] /home/travis/build/dmlc/mxnet-distro/mxnet-build/mshadow/mshadow/./tensor_gpu-inl.h:69: Check failed: e == cudaSuccess CUDA: the launch timed out and was terminated???????????????请问这是什么问题?每次运行时电脑都很卡, batch_size 设为1。


#75

po一下环境和用的哪个code吧


#76

用的是github mxnet项目下的example中的ssd代码, 环境是cuda9.0, cudnn 7.0, python 3.5, mxnet-cu90 1.0.0版本,gpu 是GTX TITANX. 谢谢


#77

主要是跑起来程序,我的电脑会非常卡,不是很理解, 有时直接卡到死机。gpu利用率一直在100%左右,大部分时间是100%。


#78

已解决,谢谢。


#79

另外还有一个问题,由于network改变了vgg原始的结构,训练必须要从scratch开始吗,还是用pretrained model初始化没改变的layers的参数,再接着训练的。。。。。。如果可以初始化部分layers的参数,请问该怎么做?。。。。。。。问题有点多,麻烦了。。。。。。


#80

請問一下,下面的指令中有些anchors被mask掉了,這樣算mean的時候除以全部anchors是不是不合理阿?
loss = F.smooth_l1((output - label) * mask, scalar=1.0)
return loss.mean(self._batch_axis, exclude=True)


#81

gpu跑满了ui响应会满,卡到死机就不应该了,也许cpu也满载了


#82

真正实验的的话,makeloss的时候会加一个weight调整,这里只是一个简单例子,相当于没调整这个weight,但是效果没太大影响


#83

谢谢回复,恩,我感觉是cpu的问题,程序里对cpu要求不高,但是我不知道哪个部分占用cpu比较大,猜测可能是读取rec生成dataIterator那部分,不知道理解的对不对。另外,想请教个问题,你改动了vgg16后面的全连接层,那么是从scratch开始训练model的吗,还是用imagenet pretrained vgg16 model初始化了一些没有改动的layer,然后开始训练的? 谢谢