怎么将xml中的所有标签都删除掉,只留文本

 <doc>abc</doc>
<doc>只要内容</doc>

像这样只要“abc只要内容”,怎么做?

用正则替换,正则为

 <[^>]+>

我觉得如果你使用java操作xml的话,用dom或者sax方式,直接提取xml中的内容就好啊。。。

 public static List getContext(String html) {
        List resultList = new ArrayList();
        Pattern p = Pattern.compile(">([^</]+)</");
        Matcher m = p.matcher(html );//开始编译
        while (m.find()) {
            resultList.add(m.group(1));//获取被匹配的部分
        }
        return resultList;
    }
    /**
     * @param args
     */
    public static void main(String[] args) {
        String a = "<doc>abc</doc><title>3232</title> <doc>只要内容</doc>";
        List list = getContext(a);
        System.out.println(list);
    }

可以用xml类库,tinyxml等,可以用函数获取tag中的值。

建议用dom4j或者类似的框架,或者jsoup