数据的提取,画图这些还要用包,可以解决一下么

img

img

文件夹中的数据文件 kzpart.csv 包含有2020年10月用户从大型家用电器和电子产品在线商店的购买数据

数据各字段含义如下:

  • event_time -事件发生时间
  • product_id -产品编号
  • category_id -产品的类别ID
  • category_code -产品的类别代码(代码名称)
  • brand -品牌名称
  • price -产品价格
  • user_id -用户ID

尝试完成以下分析,并解释分析结果

  1. 用户消费金额、消费次数的描述性统计
  2. 用户消费次数、消费金额散点图
  3. 用户消费金额分布图
  4. 用户消费次数分布图
  5. 用户累计消费金额占比

在代码注释中清晰说明分析步骤[

给个建议, 用pandas + matplotlib 解决
1.用户消费金额、消费次数的描述性统计 这个用 group by userid , 形成一个列表
2.用户消费次数、消费金额散点图 matplotlib 的 scatter
3.用户消费金额分布图 在1 的结果基础上 group by sum_price 直方图
4.用户消费次数分布图 在1 的结果 基础上group by 次数 直方图
5.用户累计消费金额占比 在3的基础上画饼图

另外, 那个CSV文件不要用excel 打开, 因为product_id,user_id 是全数字,用ue 或者 notepad++ 之类的打开看。