图像分类中数据集的问题

目前在学习图像分类，用过MNIST的数据集，格式是.npz,用过cifar-10,格式是好几个
(data_batch)
我想问的是，我自己有整理的数据集，有10个种类的文件夹，每个文件夹里对应的图片，我这种如何预处理？要不要也改成像MNIST那样的格式？那种格式怎么弄的？为什么那么弄？求解

你的图看不到，预处理取决于你的模型的输入，或者反过来说，你的模型的输入要和你的数据一致。
因为看不到图，我不知道你说的现在的图片是什么样的，但是一般来说，你需要在预处理中做以下几条：
（1）不要用jpg png这些格式，统一转换为bmp，相同的颜色深度
（2）最好将图片缩放、裁剪成为统一的长宽高度，并且，为了性能的考虑，图片的大小在不影响识别率的前提下，越小越好
（3）实际上bmp的头部也是不需要的，可以进一步转换为只有像素点的[x,y,3]形式的数据，x y是图片的长宽，而3表示r g b三个分量的值
（4）建议你文件名也用有意义的名字，比如说分类的标签，这样主程序操作起来比较方便

我的文件大概是以下这样的
比如:
---airplane
---airplane01.tif
---airplane02.tif
...
---river
---river01.tif
---river02.tif
...
---runway
---runway01.tif
---runway02.tif
...
文件夹代表一类，每一类里很多图片。
我想问的是像MNIST里面的图像集直接下载下来是看不到图片的。格式是mnist.npz，它这是把我上面这种类型给批处理后的样子吗？
要是做分类，用keras或tensorflow读入图片，可以直接像我这样读吗？还是说有什么办法弄成像MNIST那种形式？

每一个文件夹是一类直接用pytorch的imagfolder函数就可以了文件名就是lable