最近研究利用皮尔逊系数计算机器学习模型之间的相关性
请问是直接比较两个模型的y_prediction?
但是我试了之后模型相关度都达到了0.9
请问还有其他可以比较的方法吗
皮尔逊系数计算的是数据的相关性(正相关和负相关),模型之间的相关性好像没有多少人研究过。你应该给模型之间的相关性做一个定义,比如在输入相同的x下,两个模型预测值y1与y2的相关性,那么对于y1与y2你就可以用皮尔逊系数平均其相关性,用这个结果指代模型之间的相关性。同样,你也可以量化模型的一些参数指标,比如参数量、量纲、时间复杂度、空间复杂度、模型结构等参数,然后根据这些参数指标集合评价模型的相关度
机器学习笔记——皮尔逊相关系数
https://blog.csdn.net/laozhaokun/article/details/25156923
当协方差值>0时,表明两个数组正相关
当协方差值=0时,表明两个数不相关
当协方差值<0时,表明两个数组负相关。
皮尔逊相关度系数
两个变量之间的相关系数越高,从一个变量去预测另一个变量的精确度就越高,这是因为相关系数越高,就意味着这两个变量的共变部分越多,所以从其中一个变量的变化就可越多地获知另一个变量的变化。如果两个变量之间的相关系数为1或-1,那么你完全可由变量X去获知变量Y的值。
· 当相关系数为0时,X和Y两变量无关系。
· 当X的值增大,Y也增大,正相关关系,相关系数在0.00与1.00之间
· 当X的值减小,Y也减小,正相关关系,相关系数在0.00与1.00之间
· 当X的值增大,Y减小,负相关关系,相关系数在-1.00与0.00之间
当X的值减小,Y增大,负相关关系,相关系数在-1.00与0.00之间
相关系数的绝对值越大,相关性越强,相关系数越接近于1和-1,相关度越强,相关系数越接近于0,相关度越弱。
clip_image003