PCA模型可靠性的描述

请问下大家,在多元统计分析中,hotelling检验,这样表述是否正确,所有的样本T2Crit(95%)都高于T2范围,证明PCA模型是可靠的,为什么不是低于呢?

不知道你这个问题是否已经解决, 如果还没有解决的话:
  • 你看下这篇博客吧, 应该有用👉 :PCA 异常检测
  • 除此之外, 这篇博客: PCA的劣势分析中的 劣势一,在对数据完全无知的情况下,PCA变换并不能得到较好的保留数据信息。 部分也许能够解决你的问题, 你可以仔细阅读以下内容或者直接跳转源博客中阅读:

    因为PCA需要对数据进行预处理,第一步需要对其进行中心化,如果数据的尺度不统一,还需要标准化。通常的标准化方式是除以标准差。这里可能就出出现一个问题,比如标准差很小,接近于零,尤其是被噪声污染的数据,噪声的标准差对数据的放大作用更显著,而没被噪声污染的数据其在标准化的过程中放大作用较小。


如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^

在多元统计分析中,Hotelling检验是用于检验两个或多个总体均值是否相等的一种方法。在Hotelling检验中,我们计算每个样本的统计量T2值,并与临界值进行比较,以判断样本是否来自同一总体。T2值的计算与样本的协方差矩阵有关,因此在进行Hotelling检验之前通常会进行主成分分析(PCA)等降维处理,以减少变量之间的相关性,提高检验的准确性。
对于问题中的表述,是有一些问题的。如果所有样本的T2Crit(95%)值都高于T2范围,那么说明所有的样本都不来自同一总体,即样本之间存在显著差异,而不是证明PCA模型是可靠的。如果所有样本的T2值都低于T2范围,则说明样本之间的差异不显著,可能存在显著的相关性或重复性,此时PCA模型的可靠性需要进一步探讨。
因此,在进行Hotelling检验时,需要根据实际情况来综合评估T2值和T2Crit(95%)值,以判断样本是否来自同一总体,并进一步评估PCA模型的可靠性。