为啥GluonCV Model Zoo里面的`ssd_512_mobilenet1.0_voc`在VOC数据及上的`mAP`只有0.3多啊?

最近打算使用Gluoncv Model Zoo里面预训练的ssd_512_mobilenet1.0_voc,但测试的时候在VOC2007 test.txt图像集上的mAP只有0.301左右,大家有遇到这种问题么?下面是我的主要的测试代码:

x, image = gcv.data.transforms.presets.ssd.load_test(img_file, 512)      # resize the short side to 512 and keep aspect ratio
             scale = np.max(x.shape[2:]) / np.max(img.shape[:2])
             mod.predict(x)
             cls, score, bbox = mod.get_outputs()
 
             gt_bboxes, gt_labels = parse_xml_get_labels(ann_file, scale)
             gt_bboxes = nd.array([gt_bboxes])
             gt_labels = nd.array([gt_labels])
 
             eval_map.update(bbox, cls, score, gt_bboxes, gt_labels)

其中,eval_map是定义的VOCMApMetric的对象:

map_eval = metrics.voc_detection.VOCMApMetric(class_names=classes)

在上面测试的代码中,因为load_test会把最短的边resize到512,所以在读取Lable时,Ground Truth的Box也会被进行相应倍数的缩放。但为啥mAP只有0.301啊,网站上说,在VOC2007 test.txt 测试集上可以实现75的mAP啊?

谢谢!

我也是的,faster-rcnn的mAP比网站上说的低了10个百分点左右