公司需要关注商品的销售走势,目前除了直接看折线图没有更好的办法,所以想着是不是通过日期与销量的相关系数来表达商品是不是销售增长的状态。
所以根据销售情况,对表格进行了转置,让第一列为商品编码。后面按照时间顺序放置了每天的销量,希望在最后添加一列,算出商品与时间的相关系数。
```python
xx= pd.pivot_table(df4,index=[ '日期','日'],columns='商品编码', values='销售数量',aggfunc='sum', fill_value= 0).reset_index()
xg1 = pd.pivot_table(df4,index='商品编码' , columns="日" ,aggfunc='sum', values="销售数量",fill_value=0).reset_index()
xx1 = xx['日']
xx1.corr(xg1.iloc[1, 1:])
运行到是没有什么错误,能算出来一个商品的销量与时间的相关系数,但是每一行怎么循环,然后结果填到每一行最后一列就不会。希望大佬指点一下。
如下表:第一行的1-10的数字表达的日期
| 商品编码 | 1 | 2 | 3 | 4 | 5 | 7| 8 | 9 | 10 |相关系数|
| 1231 | 12 |11 | 34 | 22 | 11 | 7 | 2 | 34| 12 |
| 1232 | 1 | 3| 5 |6 | 1 | 2 | 12 | 34 | 100 |
| 1233 | 22 | 12 | 3| 5 | 2 | 1 | 0 | 0 | 0 |
| 1234| 54| 123 | 21 | 98 | 144 | 45 | 68 | 72 | 11 |
通过def设置函数没有折腾出来
通过lamada也没有搞定,求助了。