怎样用htmlparser取得标签对之间的内容?

例如:e.baidu.com我想取得那对标签之间的那个内容,即:e.baidu.com,请问该怎么进行操作?

这个不难吧!!

Parser parser;
try {
parser = new Parser("你腰抓取的url");
} catch (ParserException e) {
return null;
}
PrototypicalNodeFactory p = new PrototypicalNodeFactory();
p.registerTag(new Font());
parser.setNodeFactory(p);
NodeFilter filter = new NodeClassFilter(Font.class);
NodeList nodelist;

然后 遍历这个 nodelist 就OK了! 细节问题可以参考下 API

// 抓取 指点标签的内容 font
class Font extends CompositeTag {
private static final long serialVersionUID = 1L;
private static final String mIds[] = { "font" };
private static final String mEndTagEnders[] = { "font" };

public Font() {

}
public String[] getIds() {
    return mIds;
}
public String[] getEndTagEnders() {
    return mEndTagEnders;
}

}