用x代表数据集(只有特征),所有特征经过筛选、降维后只留几个特征;
把这几个特征列为标签y,该怎么样用代码实现啊?
import pickle
import numpy as np
import os.path
import codecs
def load_data(datafile, num_class=8, save=False, save_path='dataset.pkl'):
fr = codecs.open(datafile, 'r', 'utf-8')
train_list = fr.readlines()
labels = []
images = []
for line in train_list:
tmp = line.strip().split(' ')
fpath = tmp[0]
img = cv2.imread(fpath)
np_img = np.asarray(img, dtype="float32")
images.append(np_img)
index = int(tmp[xxx])
label = np.zeros(num_class)
label[index] = 1
labels.append(label)
if save:
pickle.dump((images, labels), open(save_path, 'wb'))
fr.close()
return images, labels
这个代码我是在修改了RCNN的预处理过程,就是读取txt文件,然后做个one-hot矩阵,看分类,由于这里我还没有试验过用到自己的数据集,所以大家有错误可以指出来,我修改一下