用Pattern和Matcher
正则表达式:
String reg = "<p.*?>.+?</p>";
申明的时候忽略大小写匹配。
不断的用Matcher的find来就行组个匹配。
最后获取到的就是p标签了
Pattern pattern=Pattern.compile("
(.+?)");我的土办法:
String [] contents=html.spilt("
";
String content;
for(int i=0;i<contents.length;i++){
content=contents[i];
content[i]=content.subString(content.indexOf(reg)+reg.length,congent.length-1);
}
System.out.println(contents.toString());
我的土办法:
String [] contents=html.spilt("</p>");
String reg="<p style=\"text-indent:2em ; padding: 3px 0px ;\">";
String content;
for(int i=0;i<contents.length;i++){
content=contents[i];
contents[i]=content.subString(content.indexOf(reg)+reg.length,congent.length-1);
}
System.out.println(contents.toString());
直接用Jsoup解析HTML即可