互信息如何应用于指标筛选?

您好 我想用互信息进行指标筛选 具体怎么应用 您更告诉我下吗
大概就是众多指标中筛掉相关性不大的 留下相关性大的

参考GPT和自己的思路:互信息是一种用于测量两个随机变量之间关联性的度量方式,它可以用于指标筛选中。在进行指标筛选时,可以首先使用互信息计算所有指标之间的关联性,并且筛选出与目标变量相关性较强的指标,并且将相关性不大的指标删除。

具体操作方法如下:

  1. 计算每个指标与目标变量之间的互信息。

  2. 对所有的指标按照与目标变量的互信息大小进行排序,选取互信息较大的指标作为筛选结果。

  3. 如果希望在保留足够多的相关指标的同时,减少维数,则可以考虑在互信息排序过程中设定一个筛选阈值,将互信息小于该阈值的指标进行删除。

需要注意的是,在使用互信息进行指标筛选时,需要提前定义目标变量,同时指标之间应该是相互独立的。 如果变量之间存在线性关联,则互信息将不再适用。

不知道你这个问题是否已经解决, 如果还没有解决的话:

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^