比如有一批订单,有如下属性:订单ID,顾客ID, 消费分店编号,消费额,顾客年龄,顾客性别
通过KMeans聚类(余弦距离)把顾客分成5类。最终得出的结果要求显示这五类顾客都包括哪些人,方差和,代表每一类顾客的特征值。
调用?算法一般说采用、使用。库一般说调用。像sklearn封装了kmean算法,可以直接调用。
而且只要几行代码(不算你准备数据集的代码)
https://www.cnblogs.com/heenhui2016/p/10988892.html
可以使用sklearn的Kmean聚类书法,但它默认使用的是欧式距离,你可以参考:
https://biopython-cn.readthedocs.io/zh_CN/latest/cn/chr15.html#sec-distancefunctions
补充:以你目前的所给的信息,分类效果估计不会怎么好,能够指示类别的信息有点少