ValueError

#ValueError: Found input variables with inconsistent numbers of samples: [283, 943]
#train_test_split()
我用train_test_split的时候input的是两个同等长度的list,但是报错说长度不一样,请问一下我这个是什么原因啊?
确认过两个都是list,所以没有dimension的问题。

img

img

样本数量不一致啊,看看这个报错信息是哪里丢出来的。触发的条件是什么

哦我stratify的参数写错了,解决了谢谢

不知道你这个问题是否已经解决, 如果还没有解决的话:
  • 你可以参考下这个问题的回答, 看看是否对你有帮助, 链接: https://ask.csdn.net/questions/841617
  • 我还给你找了一篇非常好的博客,你可以看看是否有帮助,链接:python数据分析问题TypeError: list indices must be integers or slices, not float
  • 除此之外, 这篇博客: 详解train_test_split()函数(官方文档有点不说人话)中的 2.各参数含义 部分也许能够解决你的问题, 你可以仔细阅读以下内容或者直接跳转源博客中阅读:
    1. *arrays:具有相同长度/形状的可转位序列。允许的输入是列表、numpy数组、scipy稀疏矩阵或数据帧。
    2. test_size:数据类型为float或int, 默认值为None。如果是float,则应介于0.0和1.0之间,并表示要包含在测试拆分中的数据集的比例。如果为int,则表示测试样本的绝对数量。如果没有,则该值设置为序列大小的补码。如果train_size也为None,则将其设置为0.25。
    3. train_size:数据类型为float或int, 默认值为None。如果是float,则应介于0.0和1.0之间,并表示要包含在序列拆分中的数据集的比例。如果为int,则表示训练样本的绝对数。如果没有,该值将自动设置为测试大小的补码。
    4. random_state:数据类型为int, 填入随机状态实例或无, 默认值为None。在拆分数据之前控制应用于数据的清洗,在多个函数调用之间传递一个int以获得可复制的输出。
    5. shuffle:数据类型为bool, 默认值为True。决定是否在拆分前对数据进行清洗。如果shuffle=False,则分层必须为None。
    6. stratify:输入类数组对象, 默认值为None。如果不是None,则以分层方式拆分数据,并将其用作类标签。

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^