本人小白,求大佬抓一个数据,我是考研党,考纲词有5500个,但是有些词语在真题里出现的次数为0,我把十五年的四六级还有考研真题,整理成一个文档,求大佬做一个5500词在这些真题里出现的频率表格,如图,根据词语频率的从高到低的顺序。
我当年考研也搞过这个,我记得有人做过类似的东西,参考改改就差不多吧:
利用python做词频统计 - https://blog.csdn.net/yunlongl/article/details/80317618
你整理的真题文档是什么样子的呢,还有5500个考纲词你也有文档吗?可以私发给我看看,可以试着做一下