含负数数据如何标准化

如何对既有正数又有负数的数据标准化?且标准化后数据的正负号不变。

或者 x' = x/ max(fabs(x)) ;
或者 x' = 2 * ( x - ( max(x) + min(x) ) * 0.5 ) / ( max(x) - min(x)), 但是变号,归一化到[-1, 1];
或者以均值为0计算sigma, x' = x / sigma, 归一化到 N~【0, sigma】分布

数据平移。
(1)所有的数据都加上deltaX
(2)负数搬动到正数前面(求补码)

在数据分析过程中,有时为了消除量纲单位的影响,需要提前对原始数据进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标即处于同一数量级,适合进行综合对比评价。

SPSS统计软件默认的标准化方法是Z-score法,或者叫标准差法,我习惯称之为Z得分法。这种方法基于原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。经过处理的数据符合标准正态分布,即均值为0,标准差为1。公式为:图片说明大多数软件使用者,也会欣然接受SPSS软件默认选择的Z得分法,原始数据经Z得分标准化处理后,会有一部分数据是负数,如果全都是图片说明正数,那反而才是不正常的。 上图是正态分布图,负值表示在平均水平左侧,与原始数据相对应,标准化后负数表示对应的个案原始数据在平均水平以下。

举个例子,有一组语文成绩,标准化处理后的数据如下图:图片说明第10行以下的语文成绩标准化数值均为负数,说明这些数据低于平均水平,而这组语文成绩原始数据的平均值是81.2,我们发现这些负数对应的原始成绩均小于平均值81.2。

结论:

★SPSS软件所生成的Z得分标准化变量,出现负数是正常的,代表个案原始数据低于平均水平。