为什么我准备数据集的时候程序跑不动,只能生成一个随机数,导致我的训练集和测试机划分不出来,
这是一个划分的例子
import numpy as np
from sklearn.model_selection import train_test_split
#构造一个X是5行2列的二维数组,y为5个元素的列表
X, y = np.random.randint(10,size=(5,2)), list(range(5))
X
#array([[8, 4],
[3, 0],
[9, 0],
[5, 9],
[0, 7]])
y
#[0, 1, 2, 3, 4]
#将X,y划分为训练集和测试集,测试集的比例为0.3
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=23)
X_train
#array([[9, 0],
[8, 4],
[5, 9]])
X_test
#array([[3, 0],
[0, 7]])
y_train
#[2, 0, 3]
y_test
#[1, 4]