数据集有一百多万,但是出来的结果只有几条,样本比例是0.2,要怎么做调整才能增加数据。
问题说的不清楚,什么叫“出来的结果只有几条”?“出来“指什么?“结果“指什么?“几条“指什么?
计算机编程,任何描述都必须清晰、唯一,没有歧义。
(1)你是否正确的导入数据集?读入后 print 数据集的形状,确认读入数据样本的数量吗?
(2)先 print 一下 train_1, target 的 shape, type, head,对训练数据有个初步的了解。
(3)再 print 一下 train_x, train_y, test_x, test_y 的shape
关于调参数,网上不是很多教程嘛,这个就很全:https://blog.csdn.net/qq_39777550/article/details/109277937
只要结果正常,无所谓多少,有些本来就少,这个跟你的代码和数据集有关