是否有爬虫程序能将一篇文章中的类似关键词爬下来

现在在做项目的时候遇到了一个问题,就是给常见文章进行打标签统计。
现在的方案是人工筛选文章中的标签,这很费时费力。而且信息时代中很蠢。
类似CSDN中下面推荐的标签一样,什么样的技术可以做这种爬取标签分类呢。

我不知道你说的是不是正则表达式

jsoup也是可以的
http://blog.csdn.net/qq_34309305/article/details/68922158
以下文章可供参考