如何用java抓取各大医疗网站的数据,例如医生名。看病的症状等
短一点的JSOUP等.长一点的用框JAVA的爬虫框架WebMagic.哪几个网站.瞅一眼
我一般爬网站有两种方案,一种就是直接用HttpClient打接口,把数据用JSON收到然后解析。再一种就是直接抓网页,然后解析网页元素抓到想要的东西。每个网站都有不同的抓取方案,这都要特殊的设置才行,抓包和解元素的时间比写代码的时间还要长。
专业点说就是爬虫