图像分类中数据集的问题

目前在学习图像分类,用过MNIST的数据集,格式是.npz,用过cifar-10,格式是好几个
(data_batch)
我想问的是,我自己有整理的数据集,有10个种类的文件夹,每个文件夹里对应的图片,我这种如何预处理?要不要也改成像MNIST那样的格式?那种格式怎么弄的?为什么那么弄?求解图片说明

你的图看不到,预处理取决于你的模型的输入,或者反过来说,你的模型的输入要和你的数据一致。
因为看不到图,我不知道你说的现在的图片是什么样的,但是一般来说,你需要在预处理中做以下几条:
(1)不要用jpg png这些格式,统一转换为bmp,相同的颜色深度
(2)最好将图片缩放、裁剪成为统一的长宽高度,并且,为了性能的考虑,图片的大小在不影响识别率的前提下,越小越好
(3)实际上bmp的头部也是不需要的,可以进一步转换为只有像素点的[x,y,3]形式的数据,x y是图片的长宽,而3表示r g b三个分量的值
(4)建议你文件名也用有意义的名字,比如说分类的标签,这样主程序操作起来比较方便

我的文件大概是以下这样的
比如:
---airplane
---airplane01.tif
---airplane02.tif
...
---river
---river01.tif
---river02.tif
...
---runway
---runway01.tif
---runway02.tif
...
文件夹代表一类,每一类里很多图片。
我想问的是像MNIST里面的图像集直接下载下来是看不到图片的。格式是mnist.npz,它这是把我上面这种类型给批处理后的样子吗?
要是做分类,用keras或tensorflow读入图片,可以直接像我这样读吗?还是说有什么办法弄成像MNIST那种形式?

每一个文件夹是一类 直接用pytorch的imagfolder函数就可以了 文件名就是lable