自己想尝试下抓取页面数据
想拿到的数据应该是
这一排文字
然
后自己用代码根据class拿到了
我的代码是
最后想过滤 信息 不太清楚 请教各位师哥
这是我自己的代码
public class ceshi {
public static void main(String[] args) throws IOException {
zhuaqu();
}
private static void zhuaqu() throws IOException {
// String url="http://www.buildhr.com/area/";
String url="https://www.huya.com/";
Document document = Jsoup.parse(new URL(url), 30000);
/*拿到class信息*/
Elements elementsByClass = document.getElementsByClass("huya-footer_friend");
System.out.println("拿到class所有信息"+elementsByClass);
}
}
不对劲,
getElementsByClass是获取一个列表的class相同的值
你这个只能取到那个dl标签
而且结果是这样的[dl obj] 试试用xpath取
//dl[@class='xxx']/dd/a/text()
或者使用获取到的dl那个对象继续getElementsByTag('a') 根据标签继续取,然后遍历再取每个a标签的innerText值。