xgboost二分类预测概率为什么二极化？

最近训练了一个xgboost二分类模型，训练用的是每个季度的一部分数据，每个季度的数据一样多。用训练完的模型测试第四季度的全部数据，得到的概率值是二极化的，这是为啥？我理解得到的应该概率是正态分布.....

看你的激活函数，它是非线性的，所以可以让结果更偏向一边，这是故意为之，你不希望结果出来大部分都是0.5附近模棱两可的，对吧。

我平时用这个预测并非都是在0.95附近。你可以看下你的特征，是否有个别特征重要性过高了

是不是你的正负样本不均匀，负样本太少了，导致学出来的都是正样本的规律