关于利用皮尔逊系数计算机器学习模型之间的相关性

最近研究利用皮尔逊系数计算机器学习模型之间的相关性
请问是直接比较两个模型的y_prediction?
但是我试了之后模型相关度都达到了0.9
请问还有其他可以比较的方法吗

皮尔逊系数计算的是数据的相关性(正相关和负相关),模型之间的相关性好像没有多少人研究过。你应该给模型之间的相关性做一个定义,比如在输入相同的x下,两个模型预测值y1与y2的相关性,那么对于y1与y2你就可以用皮尔逊系数平均其相关性,用这个结果指代模型之间的相关性。同样,你也可以量化模型的一些参数指标,比如参数量、量纲、时间复杂度、空间复杂度、模型结构等参数,然后根据这些参数指标集合评价模型的相关度

机器学习笔记——皮尔逊相关系数
https://blog.csdn.net/laozhaokun/article/details/25156923

参考一下

皮尔逊相关性系数和热力图_烤粽子的博客-CSDN博客_皮尔逊相关系数热力图 目录前言1. 皮尔逊相关系数2. 热力图(haetmap)注:Reference:前言特征选择是一个重要的“数据预处理”过程,在实现机器学习任务中,获得数据后通常先进行特征选择,此后再训练学习器。[1]特征选择的两大主要原因:维数灾难问题[2]。因为属性或者特征过多造成的问题,如果可以从中选择出重要的特征,使得后续学习过程仅需在一部分特征上构建模型,可以大大减轻维数灾难问题。从这个意义上... https://blog.csdn.net/Mao_Jonah/article/details/103328531?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522166933970816800182132216%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=166933970816800182132216&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_ecpm_v1~rank_v31_ecpm-3-103328531-null-null.nonecase&utm_term=%E5%85%B3%E4%BA%8E%E5%88%A9%E7%94%A8%E7%9A%AE%E5%B0%94%E9%80%8A%E7%B3%BB%E6%95%B0%E8%AE%A1%E7%AE%97%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E6%A8%A1%E5%9E%8B%E4%B9%8B%E9%97%B4%E7%9A%84%E7%9B%B8%E5%85%B3%E6%80%A7&spm=1018.2226.3001.4450

当协方差值>0时,表明两个数组正相关

当协方差值=0时,表明两个数不相关

当协方差值<0时,表明两个数组负相关。

参考一下呢

皮尔逊相关度系数
两个变量之间的相关系数越高,从一个变量去预测另一个变量的精确度就越高,这是因为相关系数越高,就意味着这两个变量的共变部分越多,所以从其中一个变量的变化就可越多地获知另一个变量的变化。如果两个变量之间的相关系数为1或-1,那么你完全可由变量X去获知变量Y的值。

· 当相关系数为0时,X和Y两变量无关系。

· 当X的值增大,Y也增大,正相关关系,相关系数在0.00与1.00之间

· 当X的值减小,Y也减小,正相关关系,相关系数在0.00与1.00之间

· 当X的值增大,Y减小,负相关关系,相关系数在-1.00与0.00之间

X的值减小,Y增大,负相关关系,相关系数在-1.000.00之间

相关系数的绝对值越大,相关性越强,相关系数越接近于1和-1,相关度越强,相关系数越接近于0,相关度越弱。

clip_image003