基于java多线程的聚焦爬虫

基于java多线程的聚焦爬虫的核心业务是,使用java程序抓取目标网站的
有效数据。并且对数据进行解析和清洗,最终将有效数据存入数据库。并且提供
数据的检索和查询系统。
1.2
①网页下载与HTML解析必须使用java程序。
②数据存储技术使用JDBC或者其他的java开源框架技术。
③数据库必须采用MySQL数据库。
④数据展示部分可以根据自己的情况定,可以使用JavaSwing或者
jsp+servlet或者其他java相关的技术。不得使用和java无关的其他技术。