深度卷积神经网络(AlexNet) 讨论区


#21

左上角点击+号,重新创建程序,复制粘贴


#22

遇到同样的问题,不知道怎么解决。。。


#24

你找到原因了么?


#25

I have the same problem, I tried different learning rate, but still have the same training accuracy. It seems that the code doesn’t learn at all.


#26

遇到同样的alex无法正常训练的问题,就好像网络没有进行学习。。。


#27

learning rate调低也不行


#28

@szha 看到好多小伙伴都遇到了同样的问题,大佬们可不可以帮忙看一下是为什么?alex都跑不过去感觉很难受, 感谢~


#29

好的,正在看


#30

@qqlu1992 @luz @JifuZhao 你们用的是什么操作系统?


#31

在AWS上的EC2 P2 instance,应该有一个K80的GPU。 我后来仔细研究过代码,代码应该没问题,但是图片resize是不是太大了, 在Alex程序里面,把resize从224改成96,可以跑成功,仅作参考


#32

ubuntu16.04,在1070上跑的,也换过ubuntu14.04的titan z跑,都是一跑电脑就死机了。不知道是不是因为楼上说的图片尺寸问题


#33

ubuntu14.04, cuda8.0


#34

把图片resize到96,是没有问题,但是224会有问题


#35

@szha 查了下图片resize到224无法正常训练的原因,定位到是在utils里的load_data_fashion_mnist函数,最后ndarray除以255时,导致所有数据变为0,debug图如下:


我先转为numpy之后除以255.0再返回ndarray就能正常训练了,
请问一下这是ndarray的问题吗?我的mxnet版本是0.12.1,谢谢


#36

@mli


#37

有点诡异,直播后我来看一下


#38

你好, 从0开始写的话, 参数的初始化只能使用random_normal而不能使用xavier吗


#39

双击cell, 将前面的三个点```python和后面的三个点```去掉, 然后更改cell类型为代码类型(快捷键是Y)


#40

我也遇到了这个问题, 不知道是什么原因


#41

Win10同遇到这个问题。。