随机森林评分模型,交叉验证环节老是出错,不出分,不知道什么原因,数据是30万的用户数据,不知道是不是超参数设置问题,总是出现continues错误
estimator=RandomForestClassifier()
param_grid={"n_estimators":[120,200,500,800,1200],"max_depth":[5,8,15,25,30]}#定义超参数选择列表
estimator=GridSearchCV(estimator,param_grid=param_grid,cv=5,n_jobs=-1)#使用GridSearchCV网格搜索
estimator.fit(x_train,y_train)
estimator.best_score_(x_test,y_test)
File "", line 4
estimator.fit(x_train,y_train)
^
SyntaxError: invalid character in identifier
报错不是提示你有语法错误吗,先检查下你的代码附近有没有非法字符
是因为目标列是真实地数字,不能作为分类问题的标签进行运算,用sklearn做分类任务的时候,y 应该是整数或者字符串型的向量。直接在y输入变量的后面加上转换数据类型为int或者string