如图,要分析HQ对于维修费用影响的分析,使用单因素方差分析的方法,但是要先对HQ进行离散化,大概分为6个level,但是对HQ进行离散化后,每个等级对应的维修费用如何确定?在R语言中使用anova函数,要先对这组数据进行怎么样的处理?
6个level的意思就是,给一段数据进行分组。这里你得先明确你研究的目的以及单因素方差分析原理。
你可以依照HQ数据具有相同特征(例如数值范围)对数据进行分组,设置为A,B,C......,分组变量的形式为HQ=c(A,A,A,A,B,B,B,B,B,B,C,C,C,C,C)
分组变量的每一个分组代表着一种处理,这里我假设HQ是设备价格217752-217749设定为“低价格”也就是A,218569-218998设置为“中等价格”,依此类推,构建level,也就是分组变量。
这里每一个分组对应数据不少与3个,且每个分组数据应各自进行方差齐性及正态性检验。