用决策树、随机森林、GBDT、XGBoost做二分类预测,用网格搜索调完参后准确率都在95以上,AUC值甚至到了0.99 是什么原因啊
可能是:① 问题本身比较简单,树模型这种非线性模型很容易区分② 有信息泄露,你的label相关信息在feature里体现了
是否存在样本不平衡的问题?如果存在,这种情况是正常的,建议增加F1等指标进行评价如果样本均衡,可能存在特征穿越