显存占用率问题


#1

大家是怎么解决显存占用率问题的。现在模型一训练11g显存就out of memory,减小了模型也不行啊。数据量变小了也不行?


#2

试下半精度训练?


#3

是不是用了几个num_workers


#4

没有用到这个num_workers,是不是因为我用的是nn.block编写的层所以显存占用率大?不是说mxnet框架优化了显存吗。感觉模型都不是很复杂,11g显存居然不够跑?