如何实现固定划分数据集。比如前80%为训练集,后20%为测试集?

如图,train_test_split为随机划分测试集与训练集,怎么才能实现固定划分呢?比如让
数据集中的前80%为训练集,后20%为测试集?

图呢?如果你的数据集目录序列为dirList,那你可以这样

split = int(len(dirList) * 0.8)
trainSet = dirList[:split]
testSet = dirList[split:]

请问您这个问题解决了吗

train_test_split传入random_state为一个固定数字,则每次划分都完全一样。