MXNET显存占用计算


#1

通过手动方式计算模型的参数和中间输出层所在的显存为2.5G,而实际计算时候,显存的实际占用巅峰在5.5G的左右,不理解中间怎么有3G的这么大的差距,有遇到过类似情景的么?还有哪些环节占用显存

MXNET 比 pytorch 更耗显存,有相同使用经历的举个爪?