想知道AUC值过高是什么原因

用决策树、随机森林、GBDT、XGBoost做二分类预测,用网格搜索调完参后准确率都在95以上,AUC值甚至到了0.99 是什么原因啊

可能是:
① 问题本身比较简单,树模型这种非线性模型很容易区分
② 有信息泄露,你的label相关信息在feature里体现了

是否存在样本不平衡的问题?如果存在,这种情况是正常的,建议增加F1等指标进行评价
如果样本均衡,可能存在特征穿越