我做的是贝叶斯结构方程模型,关于电商平台的服务质量影响因素构建,但是在做的过程中遇到了很多问题:
1,需要得出潜变量得分才能进一步划分低中高三种状态,但是这个潜变量得分是怎么算呢?
2,勉强从一个技术贴找到amos可以得出潜变量估值,不知道对不对但也只能硬着头皮算下去,但是最后在贝叶斯推理过程中,影响大的几个变量和前面在结构方程模型中路径系数比较所得到的变量不一样,这样是不是就有问题了?但是也不知道是哪有问题😭,是一开始潜变量得分就不对吗?😭
基本思路是:构造指标-计算各指标的权重-TOPSIS法进行评价
为了有效凸显出五年来帮扶单位在脱贫攻坚提升方面所作出的努力,计算了各指标的增长率,即
2020_SR/2015_SR,2020_CY/2015_CY,……,2020_ZF/2015_ZF
主成分分析法是一种线性无监督的降维方法,可以通过主成分分析法计算各指标方差贡献率,以此作为各指标的权重。接着采用TOPSIS法进行评价,TOPSIS法是一种常用的组内综合评价方法,能充分利用原始数据的信息,其结果能精确地反映各评价方案之间的差距。基本过程为基于归一化后的原始数据矩阵,采用余弦法找出有限方案中的最优方案和最劣方案,然后分别计算各评价对象与最优方案和最劣方案间的距离,获得各评价对象与最优方案的相对接近程度,以此作为评价优劣的依据。该方法对数据分布及样本含量没有严格限制,数据计算简单易行。
#构造评价指标
data_2 = pd.DataFrame(data.pivot_table(index=['帮扶单位(0-159)','村庄编号','帮扶单位类型(0-5)'],values=columns)).reset_index()
for j in range(6):
data_2['{}_增长率'.format(j)] = data_2.iloc[:,9+j]/data_2.iloc[:,j+3]
data_2 = data_2.drop(['帮扶单位(0-159)','村庄编号','帮扶单位类型(0-5)'],axis=1).drop(columns,axis=1)
c = ['CY_增长率','HJ_增长率','SR_增长率','SS_增长率','WJ_增长率','ZF_增长率']
data_2.columns = c
# 数据归一化
def Standard(data):
return (data - data.min())/(data.max()-data.min())
data_2 = Standard(data_2)
# PCA计算指标权重
from sklearn.decomposition import PCA
from sklearn import preprocessing
pca = PCA(n_components=6)
pca.fit_transform(data_2)
weight = pca.explained_variance_ratio_ #方差贡献率
print(weight)
def topsis(data, weight):
# 最优最劣方案
Z = pd.DataFrame([data.min(), data.max()], index=['负理想解', '正理想解'])
# 距离
Result = data.copy()
Result['正理想解'] = np.sqrt(((data - Z.loc['正理想解']) ** 2 * weight).sum(axis=1))
Result['负理想解'] = np.sqrt(((data - Z.loc['负理想解']) ** 2 * weight).sum(axis=1))
# 综合得分指数
Result['综合得分指数'] = Result['负理想解'] / (Result['负理想解'] + Result['正理想解'])
Result['排序'] = Result.rank(ascending=False)['综合得分指数']
return Result
results = topsis(data_2,weight)
results['帮扶单位(0-159)'] = data['帮扶单位(0-159)']
results['帮扶单位类型(0-5)'] = data['帮扶单位类型(0-5)']
results.sort_values(by='排序').head(10)