热门商品品类Top7分析
品类指商品所属分类,用户在访问电商网站时,通常会发生很多行为,如查看商品的信息、将感兴趣的商品加入购物车和购买商品等行为都将作为数据被网站存储。
某电商网站某年某月产生的用户行为数据存储在user_session.txt中,文件中每一行表示一个用户行为,所有行为都与商品和用户有关。数据集中字段含义:
下图是user_session.txt的部分截图,实际上有20多万条的数据,本人很困惑选用多少合适

txt里面的数据形式都是json格式,不知道怎么转换或者怎么进行操作User_session:用于标识用户行为的唯一值
Event_type:表示用户行为的类型,包括view(查看)、cart(加入购物车)、purchase(购买)行为
Category_id:商品品类id
User_id:用户id
Product_id:商品id
Address_name:事件发生的区域
Event_time:事件发生的时间
实现思路:首先需要分析统计各个品类商品的查看次数、加入购物车次数以及购买次数。接下来,将同一品类商品的查看、加入购物车以及购买次数合并。然后,自定义排序规则、按照各个品类中商品的查看、加入购物车次数和购买次数进行降序排序,获取排名前7的商品品类。排序时优先按照各个商品的查看次数降序排列,如果查看次数相同则按照加入购物车次数降序排列,如果前两者次数都相同则按照购买次数降序排列。最后,将同一品类的商品的查看、加入购物车和购买次数映射到自定义排序规则中进行排序处理。