筛选高价值客户的机器学习方法

根据帕累托法则,即:20%的客户购买了80%的产品/贡献了80%的收入。企业中往往称这20%能够推动公司80%的收入的客户为“高价值客户”。请从客户留存(留存的衡量方式包括但不限于客户下单时间间隔、活跃时长)、消费金额与退单率等方向,设计分析筛选高价值客户的流程与方法。

个人的想法是:根据消费总金额排序筛选出前20%的客户,计算这20%贡献的总收入是否在80%附近,如果满足帕累托法则,则将这些客户定义为高价值客户,
问题在于之后根据以上问题中的特征如何筛选出这些客户, 目前考虑到的方法较多,但是由于实战经验较少,无法得出实际方案

购买80%的产品, 这种情况发生的可能性不大。
贡献80%的收入,这个有可能。
按客户ID分组统计消费总金额, 得到数据 : 字段: 客户ID, 消费总金额
按客户的消费总金额排序(高到低), 取前20%的数据, 计算累计数。 和总累计数比较, 看是否接近0.8 , 或者是 超过0.8