有一个思路,但是自己没有能力实现

这是我自己想出来的问题但是自己解决不了得不到答案
参数五个第一个0至100的随机数;第二个0至20000的随机数;第三个-40至60的随机数;第四个2000至4000的随机数;第五个前四个参数为一组重复的次数为第五个参数
每组参数随机一万次,得到我的一组数据,我想使用python,一个算法能够算出第一个参数与后面三个参数的关系,一个算法得出得出第一个参数分别与后面三个参数的关系,最后使用聚类对数据进行可视化的分类,第五个参数可以不进行展示,但是第五个参数作为权重影响分类
我自己也会尽力去解决,相信各位一定比我优先解决

第五个前四个参数为一组重复的次数为第五个参数
啥意思
你自己先想明白,到底前4个参数是传进来的形参还是要在函数内进行随机的局部变量,不要一会觉得它是形参,一会觉得它是局部变量
此外,你自己都说前面4个都是随机数,为什么还要算第一个参数和后面参数的关系,按道理来讲就不应该有任何关系,有关系就说明搞错了

  • 你可以看下这个问题的回答https://ask.csdn.net/questions/7653291
  • 除此之外, 这篇博客: 2020华数杯C题脱贫帮扶绩效评价你怕了吗?中的 问题二:160 个帮扶单位帮扶着基础不同的村庄,帮扶单位帮扶工作的态度、目标、投入、帮扶干部素质等显然是有差异的。仅仅用 2020 年各村庄评分高低显然是无法真正有效的体现一个帮扶单位在脱贫攻坚提升方面所做出的努力。请你运用附件的数据,阐明什么类型的帮扶单位,哪些帮扶单位在脱贫帮扶上面有较高的绩效?请给不同类型的帮扶单位绩效排序,给出脱贫帮扶绩效前十名的帮扶单位编号。 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
  • 基本思路是:构造指标-计算各指标的权重-TOPSIS法进行评价
    为了有效凸显出五年来帮扶单位在脱贫攻坚提升方面所作出的努力,计算了各指标的增长率,即

    2020_SR/2015_SR,2020_CY/2015_CY,……,2020_ZF/2015_ZF
    主成分分析法是一种线性无监督的降维方法,可以通过主成分分析法计算各指标方差贡献率,以此作为各指标的权重。接着采用TOPSIS法进行评价,TOPSIS法是一种常用的组内综合评价方法,能充分利用原始数据的信息,其结果能精确地反映各评价方案之间的差距。基本过程为基于归一化后的原始数据矩阵,采用余弦法找出有限方案中的最优方案和最劣方案,然后分别计算各评价对象与最优方案和最劣方案间的距离,获得各评价对象与最优方案的相对接近程度,以此作为评价优劣的依据。该方法对数据分布及样本含量没有严格限制,数据计算简单易行。

    #构造评价指标
    data_2 = pd.DataFrame(data.pivot_table(index=['帮扶单位(0-159)','村庄编号','帮扶单位类型(0-5)'],values=columns)).reset_index()
    for j in range(6):
        data_2['{}_增长率'.format(j)] =  data_2.iloc[:,9+j]/data_2.iloc[:,j+3]
        
    data_2 = data_2.drop(['帮扶单位(0-159)','村庄编号','帮扶单位类型(0-5)'],axis=1).drop(columns,axis=1)
    c = ['CY_增长率','HJ_增长率','SR_增长率','SS_增长率','WJ_增长率','ZF_增长率']
    data_2.columns = c
    
    # 数据归一化
    def Standard(data):
        return (data - data.min())/(data.max()-data.min())
    data_2 = Standard(data_2)
    
    # PCA计算指标权重
    from sklearn.decomposition import PCA
    from sklearn import preprocessing
    pca = PCA(n_components=6)
    pca.fit_transform(data_2)
    weight = pca.explained_variance_ratio_  #方差贡献率
    print(weight)
    
    def topsis(data, weight):
        # 最优最劣方案
        Z = pd.DataFrame([data.min(), data.max()], index=['负理想解', '正理想解'])
        # 距离
        Result = data.copy()
        Result['正理想解'] = np.sqrt(((data - Z.loc['正理想解']) ** 2 * weight).sum(axis=1))
        Result['负理想解'] = np.sqrt(((data - Z.loc['负理想解']) ** 2 * weight).sum(axis=1))
        # 综合得分指数
        Result['综合得分指数'] = Result['负理想解'] / (Result['负理想解'] + Result['正理想解'])
        Result['排序'] = Result.rank(ascending=False)['综合得分指数']
        return Result
    results = topsis(data_2,weight)
    
    results['帮扶单位(0-159)'] = data['帮扶单位(0-159)']
    results['帮扶单位类型(0-5)'] = data['帮扶单位类型(0-5)']
    results.sort_values(by='排序').head(10)