使用重复元素的网络(VGG) 讨论区

那啥cnn-scratch不知道怎么使用,网站也打不开

卧槽。。。教程都不会玩?
好好去看看吧。。。
zh.gluon.ai

你这也是1个epoch之后报错??

是的,我一个epoch之后报错,很多大的网络都跑不了,只能跑一个7层的cnn。好像有个评论里面的vgg能跑,其他的reasnet和dansenet都跑不了。。。。你有遇到过这种情况么?

经常报一些memery error 还有os error

你是什么系统跑的?试试看内存在报错前后的变化,我以前好像是内存会窜得很高的占用,然后就爆内存了。。。
还可以参考这里。。。
https://discuss.gluon.ai/t/topic/1258/45?u=adaaaaaa

你截图的是Intel集成GPU,你要看GPU1才是GTX 1050 TI. 目前gluon不支持intel GPU。你看下GPU1是不是有利用率,不然就试试 mx.gpu(1)来制定使用GPU 1

不是特别理解。你GPU和CPU内存分别多少?有可能是CPU内存不够。我为了偷懒吧数据都加载到了CPU内存

我开着资源管理器查看的,cpu和内存都没占满,不过内存确实占了很多,内存我是16g的占到了10g多,我cpu是8700k程序是用gpu跑的,cpu利用率不是很高20%左右吧。 感谢老师的回复~谢谢~

10G多已经很厉害了。。。很容易爆的。。。根据我给那个链接里面大佬的改,内存占用只额外增加3G左右。。。

沐大佬。。。有空改改utils.py吧。。。
用个人电脑跑的并不都是无限内存啊。。。8G,16G内存的很容易就爆内存的。。。
我32G也爆。。。

1赞

是因为utils.py的原因吗?好的我仔细看看,你给的链接改一下。谢谢你了哈~

使用了你给的链接,里面的大神说修改utils.py 里面的load_data_fashion_mnist终于不再爆内存了,问题解决了,非常感谢你。也谢谢沐老师。不过我想问一下,跑网络的时候,cpu占用50%而gpu(1070ti)占用却很低,6%左右,是什么原因呢?明明使用的gpu跑的程序。。。。。

不清楚,我一般用aida64看的。。。或者nvidia-smi命令。。。

谢谢~;;我gpu1的利用率总是不超过5%;我用的Anaconda下的sypder,在指定 了gpu1之后总是会报kernel died ,restartingde的错

@astonzhang 我们0.7版解决吧,主要是要看下对性能的影响。 https://github.com/mli/gluon-tutorials-zh/pull/140

刚刚已经merge了下面这个PR:

gpu加速也不快啊,迭代一次几十分钟

应该不用这么久,gpu利用率如何

迭代一次350-400秒