<doc>abc</doc>
<doc>只要内容</doc>
像这样只要“abc只要内容”,怎么做?
用正则替换,正则为
<[^>]+>
我觉得如果你使用java操作xml的话,用dom或者sax方式,直接提取xml中的内容就好啊。。。
public static List getContext(String html) {
List resultList = new ArrayList();
Pattern p = Pattern.compile(">([^</]+)</");
Matcher m = p.matcher(html );//开始编译
while (m.find()) {
resultList.add(m.group(1));//获取被匹配的部分
}
return resultList;
}
/**
* @param args
*/
public static void main(String[] args) {
String a = "<doc>abc</doc><title>3232</title> <doc>只要内容</doc>";
List list = getContext(a);
System.out.println(list);
}
可以用xml类库,tinyxml等,可以用函数获取tag中的值。
建议用dom4j或者类似的框架,或者jsoup