python jupyter 写入csv文件问题(私聊有酬)

我们的作业是,他有四个csv的销售文件,见下图:

里面的文件是这样的,他要求将所有文件中有不同名称的商品更正为该商品第一次出现时的名称,并将处理结果写入到新的文件中。(这个销售数据是流水,id相同的商品可能出现多次,并且名字有更改,但是他们的id编码应该是不变的)要求写入新的四个csv文件,所有数据相同除了把商品名字名字更改为第一次出现的。

我的代码只写到这里就不会了,也不知道写得对不对,求助

import os
saleDic={}
goodsNameDic={}
fileList = [fileName for fileName in os.listdir('sales') if fileName.endswith('.csv')] 
for fileName in fileList:
    f = open('sales/'+fileName, encoding='utf8')
    flag = True
    for line in f:
        if flag:
            flag = False
            continue
        saleInfo = line.replace('"', '').split(',')
        saleDic[saleInfo[1]] = saleDic.get(saleInfo[1], 0) + int(saleInfo[-2]) #id 数量 0是默认值
        #goodsNameDic[saleInfo[1]]=saleInfo[2]
        goodsNameDic.setdefault(saleInfo[1],saleInfo[2])

提供下思路:

  • 先pd.read_csv()读取这几个文件合并成一个, 如果有日期字段按日期排序.合并的时候可以增加一个序号作为不同表的分类
  • 按id号去重drop_duplicates(), 保留第一次出现的信息,生成一个id和商品名称的表
  • 用上面的表和合并的表匹配pd.merge(), 更新商品名称字段.
  • 按第1步中生成的序号pd.groupby, 重新保存为cvs文件

您好,我是有问必答小助手,你的问题已经有小伙伴为您解答了问题,您看下是否解决了您的问题,可以追评进行沟通哦~

如果有您比较满意的答案 / 帮您提供解决思路的答案,可以点击【采纳】按钮,给回答的小伙伴一些鼓励哦~~

ps:问答VIP仅需29元,即可享受5次/月 有问必答服务,了解详情>>>https://vip.csdn.net/askvip?utm_source=1146287632

非常感谢您使用有问必答服务,为了后续更快速的帮您解决问题,现诚邀您参与有问必答体验反馈。您的建议将会运用到我们的产品优化中,希望能得到您的支持与协助!

速戳参与调研>>>https://t.csdnimg.cn/Kf0y