随机森林特征重要性排序

train_test_split() got an unexpected keyword argument 'test'
如何改正

不知道你这个问题是否已经解决, 如果还没有解决的话:
  • 你看下这篇博客吧, 应该有用👉 :train_test_split()函数
  • 以下回答来自chatgpt:

    根据参考资料和错误提示信息,可以发现代码中train_test_split()函数的参数中多了一个'test',但该参数并不在train_test_split()函数的允许的参数列表中,因此需要将代码中的'test'参数修改为正确的参数名'test_size'。

    修改后的代码如下:

    from sklearn.model_selection import train_test_split
    train_set, test_set=train_test_split(housing, test_size=0.2, random_state=42)
    train_set.info()
    test_set.info()
    
    housing['income_cat']=pd.cut(housing['median_income'],bins=[0.,1.5,3.0,4.5,6.,np.inf],labels=[1,2,3,4,5])
    
    housing['income_cat'].hist()
    %matplotlib inline
    import matplotlib.pyplot as plt
    housing['income_cat'].hist()
    plt.show()
    
    from sklearn.model_selection import StratifiedShuffleSplit
    split=StratifiedShuffleSplit(n_splits=1, test_size=0.2, random_state=42)
    for train_index, test_index in split.split(housing, housing['income_cat']):
        strat_train_set=housing.loc[train_index]
        strat_test_set=housing.loc[test_index]
    
    strat_test_set['income_cat'].value_counts()/len(strat_test_set)
    
    for set_ in (strat_train_test, strat_test_set):
        set_.drop('income_cat', axis=1, inplace=True)
    

    其中将代码中'test'修改为'test_size'即可解决问题。


如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^