取出 新华网、xinhuanet.com PHP的正则。。谢谢了。
<?php
$str="<h1><a href=\"sds\">新华网</a><span>xinhua.com</span></h1><h1><a href=\"sds\">新华网2</a><span>xinhua.com2</span></h1>";
$reg='/<a(.*?)>(.*?)<\/a><span>(.*?)<\/span>/';
preg_match_all($reg,$str,$arr);
var_dump($arr);
?>
array(4) {
[0]=>
array(2) {
[0]=>
string(50) "<a href="sds">新华网</a><span>xinhua.com</span>"
[1]=>
string(52) "<a href="sds">新华网2</a><span>xinhua.com2</span>"
}
[1]=>
array(2) {
[0]=>
string(11) " href="sds""
[1]=>
string(11) " href="sds""
}
[2]=>
array(2) {
[0]=>
string(9) "新华网"
[1]=>
string(10) "新华网2"
}
[3]=>
array(2) {
[0]=>
string(10) "xinhua.com"
[1]=>
string(11) "xinhua.com2"
}
}