yolov3模型不同尺寸的特征图对应的感受野问题理解。

而对于yolov3来说,输出为3个尺度的特征图,分别为13×13、26×26、52×52。最小的13×13的特征图上其感受野最大;中等的2626特征图上其具有中等感受野,适合检测中等大小的目标。较大的5252特征图上其具有较小的感受野,适合检测较小的目标。
我对这个感受野就不太理解。是每个grid cell对应的感受野是按照以上比例分割原图出来的那一小部分吗?但感觉这样也不对啊,这样就和感受野计算公式相悖,我从网络输出反推对应的感受野,结果得到每个grid cell对应的感受野是原图整张图片,这显然也不对,那这个感受野应该怎么理解呢?
希望解答,在这里卡了两天了。

假设原图大小为:104* 104, 三个尺度特征分别为13,26,52。都是逐步下采样得到的。
13的特征图,是原图的1/8,所以一个网格覆盖了原图8* 8的网格范围;26的特征图,是原图的1/4,可以理解为一个网格覆盖了原图4 * 4的范围。相比之下,13的特征图覆盖范围更大,所以说其感受野最大;26的次之,52的最小。