在测试集上面速度过慢是怎么回事

我自己搭建的网络用来检测目标的,我使用的方法是用9x9的滑动窗口逐个像素的滑动取patch,也就是说256x256的图像就会有(256-9+1)x(256-9+1)个patch,我在测试的时候一次跑图像上一行的数据,再将得到的结果贴到一个全0的图像中,也就是说这个步骤也要跑(256-9+1)次。
这种方式慢是应该的吗,有没有办法提高速度呢?

计算量在那里,图像处理减少计算量就要减少像素