数据归一化对相关系数r方的影响

发现一个非常奇怪的问题，因为跑模型的时候同时用到了自定义的r方函数，和sklearn里的r2 score,按理来说这两个的计算值应该差不多，但是发现当没有进行数据归一化或者只归一化了输入，这两个方法计算的r2有很大差别，想了一天也不明白为什么

看看是不是有数据样本不均衡的问题。

参考GPT和自己的思路：

首先，数据归一化可以使得数据的单位一致，对于使用距离来度量相似度的算法（如KNN）有明显的效果提高，但是对于其他算法来说可能并不是必须的。其次，对于相关系数r方的计算，数据归一化并不会改变它的数学定义和计算公式，因此两个计算方法的结果应该是一致的。

可能的原因有以下几点：

希望以上信息可以帮助您找到解决问题的方向。