请教大神们如何用java抓取不同网页(不同网站)相同属性的内容,如图:
用同一个java程序或正则一次性抓取图片上标注的内容(注:有很多这样的网页)。
内容一般在table或者div中,找出特征匹配,截取字符串就行了
对于HTML标签,最好用XML解析类库,通过XPATH等方式来查找,这样简单,也不会容易出错,正则表达式处理这个比较麻烦,而且容易出错
应该用到了,网络请求协议http!