Python 统计电影类型

如图,获得的数据是这样的

img


我该怎样把这些类型都转化为字符串然后统计出来各个类型有多少部电影、占比多少等等

你可以使用Python中的字符串操作和列表操作来完成这个任务。首先,你需要将每个电影的类型转换为字符串,并将它们存储在一个列表中。然后,你可以使用Python中的计数器来计算每个类型出现的次数,并计算它们的占比。

以下是一个示例代码,它假设你已经将电影类型存储在一个名为"genres"的列表中:

from collections import Counter

# 将电影类型转换为字符串
genres_str = [','.join(g) for g in genres]

# 计算每个类型出现的次数
genre_counts = Counter(genres_str)

# 计算每个类型的占比
total_movies = len(genres_str)
genre_percentages = {genre: count/total_movies for genre, count in genre_counts.items()}

# 打印每个类型的出现次数和占比
for genre, count in genre_counts.items():
    percentage = genre_percentages[genre] * 100
    print(f"{genre}: {count} ({percentage:.2f}%)")

这个代码将输出每个类型出现的次数和占比,类似于以下内容:

Action,Adventure,Science Fiction: 5 (50.00%)
Thriller,Science Fiction: 2 (20.00%)
Action,Adventure,Science Fiction,Thriller: 1 (10.00%)
Action,Adventure,Fantasy: 1 (10.00%)
Action,Adventure,Science Fiction,Fantasy: 1 (10.00%)

先使用pandas读取出来,然后做字符串分隔,在统计即可。参考我的博文:https://blog.csdn.net/c1007857613/article/details/130519503