全卷积网络(FCN)讨论区


#71

排版有点乱,输出大小不仅仅和kernel size有关,还和stride, padding有关


#72

嗯嗯,确实是自己没注意看网络参数。谢谢了


#73

两种方法都可以的


#74

输入是224 x 224,是个方形


#75

我换成cudnn5 就好了


#76

初学fcn, 有几个问题请教一下。

尝试运行了一下程序,10个epoch过后运行结果和示例图片类似。
火车都为棕色,最后一个羊则为绿色。 这个应该是表明分类是完全错误的吧。
(实际上火车应该是绿的,羊是棕的?)

acc在这里感觉不能很好衡量,大部分图背景都是黑的。是不是应该计算一下准确率和召回率?


#77

一般算 pix accuracy 和 mean IoU


#79

有没有办法将数据 做成rec文件?一次性读进内存就内存爆了 16g内存。。。。。


#80

image
使用utils.train的方式训练,准确率这么大要怎么解决啊。。。


#81

我使用了教程里的代码,成功运行了。可是得不到任何结果。我用的是自己的训练集,原始图像是256x256的rgb图片,然后分割标记的图片是只有两个颜色(黑色和白色,黑色是背景,白色是目标)的rgb图片。请问代码里的图片size是可以被修改的么?不一定要求是480x320吧?我看到有的代码生成fcn model都是需要图片size的。这里的fcn网络没有设置图片size的地方,应该和图片size是没有关系的吧?谢谢!


#82

我也遇到相似的问题,弱弱问下怎么换root路径呢


#83

from mxnet.gluon.model_zoo import vision as models
pretrained_net = models.resnet18_v2(pretrained=True, root=‘E:\gluon_lecture’)


#84

大佬,关于标签图的序号转换有个问题:

colormap = [[0,0,0],[128,0,0],[0,128,0], [128,128,0], [0,0,128],
[128,0,128],[0,128,128],[128,128,128],[64,0,0],[192,0,0],
[64,128,0],[192,128,0],[64,0,128],[192,0,128],
[64,128,128],[192,128,128],[0,64,0],[128,64,0],
[0,192,0],[128,192,0],[0,64,128]]
这里颜色是不是不全,原图似乎还有一种[224,224,192]的乳白色,比如最后预测时羊那张图左边就是,但好像在其他图里都代表不同标签,是不是“其他”的意思?但官网似乎又没有这个分类


#85

我也是,而且人是青色的不是它标签里粉色的,额,你现在知道原因了吗……


补充:神奇的是,我用了下现在教程里的程序(我这个教程似乎有些旧了),这次颜色都显示对了。如果我没记错,上一版的教程里最后的预测图就是和标签不一样。问题是我自己怎么对比两版程序,实在看不出哪改动了……


补充2:神了,我用文档对比才发现,差别在预测时把标签转换回去这一步,不知道是为什么

def predict(im):
    data = normalize_image(im)
    data = data.transpose((2,0,1)).expand_dims(axis=0)
    yhat = net(data.as_in_context(ctx[0]))
    pred = nd.argmax(yhat, axis=1)
    return pred.reshape((pred.shape[1], pred.shape[2]))

def label2image(pred):
    x = pred.astype('int32').asnumpy()
    cm = np.array(colormap).astype('uint8') ##把这个np改成nd颜色就对了
    return nd.array(cm[x,:])

#86

双线性差值部分有问题, 一开始factor就应该转float, 不然他在上面就是int出来, 直接就变成了 1

python 2.7 错误?


#87

gluon-cv 里面有比较好的fcn implemntation 有兴趣可以看一看


#88

大家试过gluon-cv的FCN实现吗?我在尝试load pretrained model的时候报错。

net = fcn.get_fcn_voc_resnet50(pretrained=True, ctx=mx.gpu())

AssertionError: Failed to load Parameter ‘fcn1_dilatedresnetv00_conv0_weight’ on [gpu(0)] because it was previous initialized on [cpu(0)].


#89

请问找到 语义分割数据 做成 rec 文件的方法了吗?


#90

用论文中的vgg16效果比resnet18-v2好很多


#91

弱弱的问一句,FCN中的最后一层Conv2DTranpose()的参数是怎么确定的呀,我知道这个Strides应该就是前向传递过程中所有的Strides的乘积,但是剩下的Kernel size和Padding应该怎么计算呢?比如教程里面为啥设置Kernel size为64、Padding=16?