[当前最佳0.00000 @ypw/ 0.20631 @LeeJuly30] Kaggle ImageNet Dogs


#227

感谢@ypw的代码分享,参考着用gluon实现了之前keras写的代码。未使用 stanford数据集,测试了下


#228

感谢。我自己的问题找到了,label的顺序乱了。


#229

在使用gluon.data.DataLoader里面的num_workers时遇到了问题:
跑第一个epoch时正常, 用top命令可以看到CPU有多个进程在读取和预处理数据;
第二个epoch开始出现问题,不报错但是python2.7的CPU占用率为零。


#230


update一下成绩,需要深入思考一下如何继续提高了,似乎遇到了瓶颈。


#231

并没有什么用


#232

http://zh.gluon.ai/chapter_gluon-advances/multiple-gpus-gluon.html

gluon.utils.split_and_load(data, ctx)


#233

用了 @ypw 的代码 和 stanford 数据, 很给力.


#234

调了一下参数, 改了 @ypw 两行代码

epochs = 300
lr_sch = mx.lr_scheduler.FactorScheduler(step=3000, factor=0.5)


#235


未使用stanford数据. 主要参考@ypw的代码. 之前也是遇到了inceptionv3效果没有@ypw的效果好,看到昨天小伙伴的帖子. 根据@root的建议升级mxnet到0.12.1b20171126. inception得到了正常的结果.
然后根据个人测试的单模型成绩,选择了inceptionv3, resnet152, resnet101_v1, densenet161四个模型融合,得到了这个成绩.


#236

第一次使用Gluon,未使用stanford数据,微调resnet-152-v2,训练了100个epoch


继续调参


#237

用的是 resnet50_v2, 参数基本没有什么变化。


#238

进楼学习~


#239

恭喜恭喜,一下子前进287 :grinning:


#240

使用resnet152v1预训练网络,后加两层全连接,resenet 部分参数固定不动。结果如下


#241

V2 是不是没有预训练的模型啊。。。。


#242

预训练的模型清单:

   ('44335d1f0046b328243b32a26a4fbd62d9057b45', 'alexnet'),
    ('f27dbf2dbd5ce9a80b102d89c7483342cd33cb31', 'densenet121'),
    ('b6c8a95717e3e761bd88d145f4d0a214aaa515dc', 'densenet161'),
    ('2603f878403c6aa5a71a124c4a3307143d6820e9', 'densenet169'),
    ('1cdbc116bc3a1b65832b18cf53e1cb8e7da017eb', 'densenet201'),
    ('ed47ec45a937b656fcc94dabde85495bbef5ba1f', 'inceptionv3'),
    ('d2b128fa89477c2e20061607a53a8d9f66ce239d', 'resnet101_v1'),
    ('6562166cd597a6328a32a0ce47bb651df80b3bbb', 'resnet152_v1'),
    ('38d6d423c22828718ec3397924b8e116a03e6ac0', 'resnet18_v1'),
    ('4dc2c2390a7c7990e0ca1e53aeebb1d1a08592d1', 'resnet34_v1'),
    ('2a903ab21260c85673a78fe65037819a843a1f43', 'resnet50_v1'),
    ('8aacf80ff4014c1efa2362a963ac5ec82cf92d5b', 'resnet18_v2'),
    ('0ed3cd06da41932c03dea1de7bc2506ef3fb97b3', 'resnet34_v2'),
    ('eb7a368774aa34a12ed155126b641ae7556dad9d', 'resnet50_v2'),
    ('264ba4970a0cc87a4f15c96e25246a1307caf523', 'squeezenet1.0'),
    ('33ba0f93753c83d86e1eb397f38a667eaf2e9376', 'squeezenet1.1'),
    ('dd221b160977f36a53f464cb54648d227c707a05', 'vgg11'),
    ('ee79a8098a91fbe05b7a973fed2017a6117723a8', 'vgg11_bn'),
    ('6bc5de58a05a5e2e7f493e2d75a580d83efde38c', 'vgg13'),
    ('7d97a06c3c7a1aecc88b6e7385c2b373a249e95e', 'vgg13_bn'),
    ('649467530119c0f78c4859999e264e7bf14471a9', 'vgg16'),
    ('6b9dbe6194e5bfed30fd7a7c9a71f7e5a276cb14', 'vgg16_bn'),
    ('f713436691eee9a20d70a145ce0d53ed24bf7399', 'vgg19'),
    ('9730961c9cea43fd7eeefb00d792e386c45847d6', 'vgg19_bn')]}

#243

还是培神大法好啊!!对了,使用了 Stanford 数据集


#244

用resnet18_v2得到的非常糟糕的结果,好在终于要有GPU了,可以在截止日期之前调一波参数。


#245


ResNet152_v1+Inceptionv3
奇怪的是在验证集上的loss只有0.24,但是准确率和0.27的都在91%附近 :smile:


#246

另外有大佬尝试用mix up吗
我自己实现了一个结果Loss是0.276,没啥提升 而且收敛的也比较慢 难道是我实现的姿势有问题? :sweat_smile: