xgboost二分类预测概率为什么二极化?

最近训练了一个xgboost二分类模型,训练用的是每个季度的一部分数据,每个季度的数据一样多。用训练完的模型测试第四季度的全部数据,得到的概率值是二极化的,这是为啥?我理解得到的应该概率是正态分布.....

看你的激活函数,它是非线性的,所以可以让结果更偏向一边,这是故意为之,你不希望结果出来大部分都是0.5附近模棱两可的,对吧。

我平时用这个预测并非都是在0.95附近。你可以看下你的特征,是否有个别特征重要性过高了

是不是你的正负样本不均匀,负样本太少了,导致学出来的都是正样本的规律