正则表达式无法匹配

正则表达式:地\s*址.+>

(.+)
匹配字符串:
地  址:
高新区1号

需要取到的字符串:高新区1号

在正则工具(RegexBuddy)中可以正确匹配,但是在下列JAVA代码里却不能,何故?

[code="java"]
public static void main(String[] args) {
Pattern p = Pattern.compile("地\s*址.+>

(.+)");
Matcher matcher = p.matcher("<dl class=\"wid600\"><dt>地  址:</dt><dd><a target=\"_blank\">高新区1号</a></dd></dl>");

while(matcher.find()){
    System.out.println(matcher.groupCount());
    System.out.println(matcher.group(1));
}

}
[/code]
[b]问题补充:[/b]
这段代码的运行结果是没有任何输出

matcher.find()结果是false

能否提供一个正确的将“高新区”分组的正则表达式

大概是因为Java标准库里的正则表达式引擎不认为全角空格是\s可匹配的内容吧……
这样就看到输出:
[code="java"]public static void main(String[] args) {
Pattern p = Pattern.compile("地[\s ]*址.+?>

(.+?)");
Matcher matcher = p.matcher("<dl class=\"wid600\"><dt>地  址:</dt><dd><a target=\"_blank\">高新区1号</a></dd></dl>");

while (matcher.find()) {
    System.out.println(matcher.groupCount());
    System.out.println(matcher.group(1));
}

}[/code]

. 任何字符(与行结束符可能匹配也可能不匹配)

java里默认是贪婪匹配

也就是用地\s*址.+就已经把“:

高新区1号
”全部匹配了

试试用QuickREx来写正则表达式吧。很强大,实时验证匹配情况。容易找错。

哦,崩溃,"地址"两个字之间不知道是什么东西,\s是不能匹配的

[quote="ranLoD"]哦,崩溃,"地址"两个字之间不知道是什么东西,\s是不能匹配的[/quote]
那个就是全角空格。所以我前面的回答里在正则表达式里加上了全角空格就能匹配了……