我自己想匹配一个网站上的一个嵌套标签, 和嵌套的,我自己先把两个标签分开进行匹配,可以成功地匹配到a标签和span标签。但是将他们嵌套在一起的时候就出问题了,我感觉问题是在于这个网页标签之间的换行符,但是这个换行符要怎么解决啊?
这个是那个嵌套标签的格式
<a-href="wsgewegwg"-target="_blank"-title="">
内容区域
<span-style="ergeg:erge:ergherhg">[认证]</span>
</a>;
然后这个是我自己写的正则表达式:
'/<a href=\"(.*)\" target=\"_blank\" title=\"\">([\s\S]*)<span style=\"(.*)\">([\s\S]*)<\/span><\/a>/'
用*?,非贪婪匹配
'/<a href=\"(.*)\" target=\"_blank\" title=\"\">([\s\S]*?)<span style=\"(.*)\">([\s\S]*?)<\/span><\/a>/'