正则表达式:地\s*址.+>
需要取到的字符串:高新区1号
在正则工具(RegexBuddy)中可以正确匹配,但是在下列JAVA代码里却不能,何故?
[code="java"]
public static void main(String[] args) {
Pattern p = Pattern.compile("地\s*址.+>
Matcher matcher = p.matcher("<dl class=\"wid600\"><dt>地 址:</dt><dd><a target=\"_blank\">高新区1号</a></dd></dl>");
while(matcher.find()){
System.out.println(matcher.groupCount());
System.out.println(matcher.group(1));
}
}
[/code]
[b]问题补充:[/b]
这段代码的运行结果是没有任何输出
matcher.find()结果是false
能否提供一个正确的将“高新区”分组的正则表达式
大概是因为Java标准库里的正则表达式引擎不认为全角空格是\s可匹配的内容吧……
这样就看到输出:
[code="java"]public static void main(String[] args) {
Pattern p = Pattern.compile("地[\s ]*址.+?>
Matcher matcher = p.matcher("<dl class=\"wid600\"><dt>地 址:</dt><dd><a target=\"_blank\">高新区1号</a></dd></dl>");
while (matcher.find()) {
System.out.println(matcher.groupCount());
System.out.println(matcher.group(1));
}
}[/code]
. 任何字符(与行结束符可能匹配也可能不匹配)
java里默认是贪婪匹配
也就是用地\s*址.+就已经把“:
试试用QuickREx来写正则表达式吧。很强大,实时验证匹配情况。容易找错。
哦,崩溃,"地址"两个字之间不知道是什么东西,\s是不能匹配的
[quote="ranLoD"]哦,崩溃,"地址"两个字之间不知道是什么东西,\s是不能匹配的[/quote]
那个就是全角空格。所以我前面的回答里在正则表达式里加上了全角空格就能匹配了……