这是我自己想出来的问题但是自己解决不了得不到答案
参数五个第一个0至100的随机数;第二个0至20000的随机数;第三个-40至60的随机数;第四个2000至4000的随机数;第五个前四个参数为一组重复的次数为第五个参数
每组参数随机一万次,得到我的一组数据,我想使用python,一个算法能够算出第一个参数与后面三个参数的关系,一个算法得出得出第一个参数分别与后面三个参数的关系,最后使用聚类对数据进行可视化的分类,第五个参数可以不进行展示,但是第五个参数作为权重影响分类
我自己也会尽力去解决,相信各位一定比我优先解决
第五个前四个参数为一组重复的次数为第五个参数
啥意思
你自己先想明白,到底前4个参数是传进来的形参还是要在函数内进行随机的局部变量,不要一会觉得它是形参,一会觉得它是局部变量
此外,你自己都说前面4个都是随机数,为什么还要算第一个参数和后面参数的关系,按道理来讲就不应该有任何关系,有关系就说明搞错了
基本思路是:构造指标-计算各指标的权重-TOPSIS法进行评价
为了有效凸显出五年来帮扶单位在脱贫攻坚提升方面所作出的努力,计算了各指标的增长率,即
2020_SR/2015_SR,2020_CY/2015_CY,……,2020_ZF/2015_ZF
主成分分析法是一种线性无监督的降维方法,可以通过主成分分析法计算各指标方差贡献率,以此作为各指标的权重。接着采用TOPSIS法进行评价,TOPSIS法是一种常用的组内综合评价方法,能充分利用原始数据的信息,其结果能精确地反映各评价方案之间的差距。基本过程为基于归一化后的原始数据矩阵,采用余弦法找出有限方案中的最优方案和最劣方案,然后分别计算各评价对象与最优方案和最劣方案间的距离,获得各评价对象与最优方案的相对接近程度,以此作为评价优劣的依据。该方法对数据分布及样本含量没有严格限制,数据计算简单易行。
#构造评价指标
data_2 = pd.DataFrame(data.pivot_table(index=['帮扶单位(0-159)','村庄编号','帮扶单位类型(0-5)'],values=columns)).reset_index()
for j in range(6):
data_2['{}_增长率'.format(j)] = data_2.iloc[:,9+j]/data_2.iloc[:,j+3]
data_2 = data_2.drop(['帮扶单位(0-159)','村庄编号','帮扶单位类型(0-5)'],axis=1).drop(columns,axis=1)
c = ['CY_增长率','HJ_增长率','SR_增长率','SS_增长率','WJ_增长率','ZF_增长率']
data_2.columns = c
# 数据归一化
def Standard(data):
return (data - data.min())/(data.max()-data.min())
data_2 = Standard(data_2)
# PCA计算指标权重
from sklearn.decomposition import PCA
from sklearn import preprocessing
pca = PCA(n_components=6)
pca.fit_transform(data_2)
weight = pca.explained_variance_ratio_ #方差贡献率
print(weight)
def topsis(data, weight):
# 最优最劣方案
Z = pd.DataFrame([data.min(), data.max()], index=['负理想解', '正理想解'])
# 距离
Result = data.copy()
Result['正理想解'] = np.sqrt(((data - Z.loc['正理想解']) ** 2 * weight).sum(axis=1))
Result['负理想解'] = np.sqrt(((data - Z.loc['负理想解']) ** 2 * weight).sum(axis=1))
# 综合得分指数
Result['综合得分指数'] = Result['负理想解'] / (Result['负理想解'] + Result['正理想解'])
Result['排序'] = Result.rank(ascending=False)['综合得分指数']
return Result
results = topsis(data_2,weight)
results['帮扶单位(0-159)'] = data['帮扶单位(0-159)']
results['帮扶单位类型(0-5)'] = data['帮扶单位类型(0-5)']
results.sort_values(by='排序').head(10)