[最高0.9853! @zzc1995,分数持续更新中] 动手玩Kaggle比赛------使用Gluon对原始图像文件分类(CIFAR-10) 讨论区


#436

batchsize是多少?我在两块1080Ti上可以跑(L=190,k=40),batchsize只能设到30,每块卡的显存占用不到10个G。


#437

titanx 3:30一个epoch大概


#438

想问一下您的ResNeXt的结果是多少,看了一下您的代码网络好像挺浅的,我训练了一个比较浅的Resnext结果还没有resnet-v2结果好 :joy:


#439

94.98


#440

我用的论文中的batchsize:64.可能我直接用参数倍数关系的计算不合理,我按你的试试:handshake:


#441

你网络结构用的是densenet-BC吧?


#442

这个想法在你们做ensemble的时候我就在试了。我只用了resnet和densenet。训了几种classifier,并没有ensemble效果好。


#443

对。你的配置可以跑,赞!显存16499M


#444

沐神,mixup不是一个类似 data augmentation的操作吗?


#445

densenet-BC(L=190 k=40)跑一个epoch大概要多久?


#446

哦,那我理解错了。mixup是指这篇paper吗 https://arxiv.org/pdf/1710.09412.pdf


#447

我觉得楼上的小伙伴用的大概就是ensemble吧,应该不是mixup这种操作


#448

我这边是19分多一个epoch。你用两个gpu,应该快的多吧


#449

没快很多,16分钟左右。


#450

速度瓶颈很有可能是在IO上。因为每次transform都是一次python call,那个消耗很大。


#451

那请教一下沐神, 有没有推荐的实现方法可以加快transform?


#452

谢谢谢谢


#453

是的1据说可以上97


#454

请问1是什么意思, 有跑到97的结果吗


#455

Look at Figure 3: Test errors for ERM and mixup on the CIFAR experiments