MovieLens-100K数据,包含943个用户对1,682个电影的1,000,000个评分记录。数据分为三个文件。
users.txt (user_id|age|gender|occupation|zip_code)
movies.txt (movie_id|movie_title|release_date|video_release_date|IMDB_url|[tag],其中,tag 分为19个属性,分别对应unknown | Action | Adventure | Animation | Children's | Comedy | Crime | Documentary | Drama | Fantasy | Film-Noir | Horror | Musical | Mystery | Romance | Sci-Fi | Thriller | War | Western,取值为1代表该电影属于该标签,0则代表不属于该标签,一个电影可能有多个标签)
ratings.txt (user_id movie_id rating timestamp,其中,timestamp为自1/1/1970 UTC0点以来的UNIX秒数)
问题:在用户dataframe数据表中,添加19个新的属性,分别对应19个电影标签,其中数值为相应用户观看具有此标签电影的数量。(dataframe已做出)