在随机森林中,重要性高的特征是不是意味着在预测结果时被赋予了更大的权重呢?
下图比较直观地展示了随机森林算法(图片出自文献2)
是在训练的时候赋予更大的权重,而不是预测,这个也是随机森林可以评估每个特征重要性的一个特点之一。
预测的时候,是他本身就会比其他特征的权重高,所以重要特征对于结果的影响大。
上面所说的权重高是指影响大小,而不是本身数值高低(拿0-1二分类举例来说,某个特征有出现就是负类,那么他的权重可能会是0,或者一个很大的负值,来将其他特征累积的权重拉到最低,就数值上来说并不是最大,但是从结果影响来说,这个权重是很高的)