如何让多组数据使用同一组标签编码

例如,使用sklearn的标签编码将训练集进行处理,那么测试集如何也使用一样的标签编码?
我对训练集和测试集使用标签编码,结果特征的标签编码不同,怎么解决?

你不要直接对数据用fit_transform,而是先对训练集fit后,再对训练集和测试集transform,如下例:

from sklearn.preprocessing import LabelEncoder
# 编码器
le = LabelEncoder()
# 训练集你和标签编码规则
le.fit(train_data['col1'])
# 训练集标签编码
train_data['col1'] = le.transform(train_data['col1'])
# 测试集标签编码
test_data['col1'] = le.transform(test_data['col1'])