利用Python统计书单文件

需求:恰当处理收集好的书单文件(约有150)(文件类型为txt),每个书单文件有10本书信息,编写实现统计功能,要求统计出同学读得最多的前十本书信息,所有统计信息写入文件保存。需要使用Python实现。
需要讲解一下大概思路,要使用哪些代码,如果有代码展示最好。

这个就把文件读进来统计一下书单的次数就行了,我写个样例,你测试一下,有问题的话可以发我文件调试一下

import os

path1='D:/test/'  ##书单文件夹
fs=os.listdir(path1)

dic={}
for f is fs:
    with open(f,'r') as f:
        data=f.read()
    data=[i for i in data.split('\n') if i!='']
    for i in data:
        dic[i]=dic.get(i,0)+1

a1 = sorted(dic.items(), key=lambda x: x[1])
print(a1[0:10])

这个实现方式有很多,因为不知道你的书单文件结构是什么样的,没法给具体的代码,基本思路是这样的:
1、把书单文件放到一个统一的目录下,用os.listdir()函数把书单文件集合读取到
2、遍历书单文件集合,用open()函数依次打开每个文件,用read()函数读取文件所有内容,然后进行分割,如果是每本书一行,就用\n分割,如果是用逗号间隔开,就用逗号分割,得到每个书单文件内的书名目录
3、两种方案,可以用列表也可以用字典
3.1、列表:书名目录存到一个大的列表中,用set()函数去重,然后遍历去重后的列表,利用count()函数去大列表中计算每本书出现的次数,这样可以得到一个次数列表,取出现次数前10的书籍就可以了
3.2、字典:用书名做key,次数做value,遍历所有书名目录,字典中存在的次数+1,不存在的在字典中添加该书名,次数初始化为1,然后统计value最大的10个书名