机器学习解决二分类问题中,对分类变量进行独热编码后,如果再进行特征重要性排序,就会出现多个哑变量出现在重要性排序里的情况。例如性别男,性别女均在重要性排序中,而我想看的是性别这个总的特征的重要性
这种情况是应该拒绝独热编码,还是应该先筛选变量?