请问将csv文件的训练集切割成训练集和测试集然后在运行该如何切割,代码有无
对于切割后的训练集,可以用pandas中的loc函数取出各个部分dataframe。代码如下:
import pandas as pd
from numpy.random import RandomState
df = pd.read_csv('data0.txt',header=None)
rng = RandomState()
train = df.sample(frac=0.7, random_state=rng)
test = df.loc[~df.index.isin(train.index)]
print(train,len(train))
print(test,len(test))
for i in range(0,len(train),len(train)//3):
a=train.reset_index().loc[i:i+len(train)//3,:]
print(a)
如对你有帮助,请点击我回答右上角【采纳】按钮采纳支持一下。