#数据预处理
#图片加载
# 读取图片+数据处理函数
def read_img(path):
print("数据集地址:"+path)
imgs = []
labels = []
for root, dirs, files in os.walk(path):
for file in tqdm(files):
# print(path+'/'+file+'/'+folder)
# 读取的图片
img = cv2.imread(os.path.join(root, file))
# skimage.transform.resize(image, output_shape)改变图片的尺寸
img = cv2.resize(img, (w, h))
# 将读取的图片数据加载到imgs[]列表中
imgs.append(img)
# 将图片的label加载到labels[]中,与上方的imgs索引对应
labels.append(str(os.path.basename(root)))
return imgs,labels
# 调用读取图片的函数,得到图片和labels的数据集
data1, label1 = read_img(train_img_url)
原始图片数量:
1: 1090, 0: 572
其中0为有异物的图片,1为无异物的正常图片。
完成数据增强后数量: