将文件读取的数据切分,随机选择80%的数据作为训练集,剩余的20%的数据作为测试集
读取文件的数据存放在列表中,用random.sample()随机选择80%的数据下标,根据下标把数据分成功两组
例子代码如下:(如有帮助,望采纳!谢谢! 点击我这个回答右上方的【采纳】按钮)
import random
with open(r'data.txt', 'r', encoding='utf-8') as fileObj:
li = fileObj.readlines()
l = len(li)
r = random.sample(range(l),k=int(l*0.8))
list1 = []
list2 = []
for i,v in enumerate(li):
if i in r:
list1.append(v)
else:
list2.append(v)
print(list1)
print(list2)