线性回归分析删除离散点

一元线性回归分析中,用哪些方法可以检测并删除图片中离散的点?

img

在线性回归分析中,离群值(异常值)可能会对回归系数产生显著影响,从而影响回归模型的准确性和可靠性。因此,有时需要从数据中删除这些离群值,并重新拟合回归模型。 以下是一些删除离散点的方法:

  1. 筛选法:通过如箱线图、标准差分析法等分析数据,将超出某个设定阈值的数据视为离群值,这个阈值可按照实际情况进行调整。然后,将识别出来的离群值从数据中删除,并用剩余的数据做回归分析。
  2. Cook’s 距离法:对于每个观测点,计算其在不含该点的数据集下的回归系数变化大小,即 Cook’s 距离。如果 Cook’s 距离大于某一设定阈值,则该观测点被认为是离群点。然后,将识别出来的离群点从数据中删除,并用剩余的数据做回归分析。
  3. Mahalanobis 距离法:对于每个观测点,计算其与其他数据点的 Mahalanobis 距离。如果距离大于某一设定阈值,则该观测点被认为是离群点。然后,将识别出来的离群点从数据中删除,并用剩余的数据做回归分析。 上述方法是一些常见的离群值检测方法,通过这些方法可以删除离群点以提高回归模型的准确性和可靠性。但需要注意的是,删除离散点的同时,也会损失一些数据,因此需要根据实际情况进行综合考虑。