最近在爬新浪微博,我将内容爬取下来后,用结巴分词后,取出里面的地理名词,我想以省份为单位统计事件发生的次数,可是我怎么根据市名或者区名或者县名 知道它属于哪个省份? 有相关方面的词库?或者什么方法吗?求大神指点
这里有数据,自己拿下来分析http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201703/t20170310_1471429.html