我抓取的网页里面有这么一段:
[quote]
Every drop you drink makes your life tastier!
点点滴滴,生活更美!——美汁源
A good plan today is better than a perfect plan tomorrow.--Wag the Dog
今天的好计划胜过明天的完美计划。--《摇尾狗》
We are what we repeatedly do. Excellence, then, is not an act, but a habit.
重复的行为造就了我们;因此,卓越不是一种举动,而是一种习惯。
There is no elevator to success. You have to take the stairs.
成功没有电梯,只有一步一个脚印的楼梯。
What we know or what we believe is, in the end, of little consequence. The only consequence is what we do.
我们知道的或相信的,本质上并不重要。唯一重要的是:我们做的。
[/quote]
现在我要读取成列表的形式。请问怎么读取呢?
日期 英文 中文
2011-12-22 Every drop you drink makes your life tastier! 点点滴滴,生活更美!——美汁源
2011-12-21 A good plan today is better than a perfect plan tomorrow.--Wag the Dog 今天的好计划胜过明天的完美计划。--《摇尾狗》
或者你换个思路
TagNode应该是有getChildren()的方法获得及标签节点,tagNode.getChildren();
还有nextNode()方法获取相邻节点
你可以先获得
可以用htmlparser处理的
其实主要是这么两个类 一个是
[code="java"]
NodeFilter exampleFilter = new HasAttributeFilter("class", "example english");
NodeFilter senFilter = new HasAttributeFilter("class", "sen");[/code]
可以获取class为example english的标签类
另一个是OrFilter 或者是 AndFilter
[code="java"]Parser parser;
OrFilter orFilter = new OrFilter();
orFilter.setPredicates(new NodeFilter[] { exampleFilter , senFilter});
NodeList nodelist = parser.parse(orFilter ); //获取class为example english和sen的标签[/code]
[code="java"]parser = Parser.createParser(htmlStr, "utf8");
OrFilter orFilter = new OrFilter();
orFilter.setPredicates(new NodeFilter[] { exampleFilter , senFilter});
NodeList nodelist = parser.parse(orFilter ); //获取class为example english和sen的标签[/code]
在给你个例子
[url]http://hi.baidu.com/bi2000yi/blog/item/b2ca7110c40f97f5c3ce790c.html[/url]
网上还有很多可以搜一下htmlparser例子参考一下