解析HTML(RCP中获得本地天气预报)

java怎么解析HTML?

看了很多web service都是要输入城市才能获得天气的,我想在程序中显示当地天气情况

所以现在方法是发一个HTTP请求到http://www.265.com/weather/59131.htm然后解析显示天气

请问该如何解析HTML

我用dom会有Invalid byte 2 of 2-byte UTF-8 sequence.错误

[code="java"]DocumentBuilderFactory domfac=DocumentBuilderFactory.newInstance();
DocumentBuilder dombuilder=domfac.newDocumentBuilder();
Document doc=dombuilder.parse(url.openStream());[/code]

这样转码,就可以了:
[code="java"]Document doc=dombuilder.parse(new InputSource(new InputStreamReader(url.openStream())));[/code]

编码错误。

返回的HTML是GB2312的,用dom解析时应该转为UTF-8

试试HTMLParser,很不错~