能不能帮我解释一下这句话:
“当特征集里含有大量的冗余特征时,由于冗余特征之间的关联性较强,具有相似的(分类)性能,也会产生多个具有近似性能的特征子集,从而影响算法的稳定性。”(出处:https://tech.hqew.com/fangan_1573971)
这里说也会产生多个具有近似性能的特征子集是什么意思?影响稳定性在这里是说降低了稳定性吗,然而我在一篇名为《Comparison of Stability for Different Families of Filter-Based and Wrapper-Based Feature Selection》的文献里看到说冗余直接提高了稳定性,这应该怎么理解呢?
假设原始特征为ABCD,存在冗余后变成AaBbCcDd。
那么ABCD,abcd,ABcd,abCD,Abcd........等等都是AaBbCcDd近似性能的特征子集。
作者说影响的稳定性是指提升稳定性,在只有4个特征时(ABCD),但凡缺一个就会导致判断失误;而存在冗余特征时(AaBbCcDd),缺了部分特征对判断失误影响不大