正则式提取网页标签内容

<tr>
<th class="a-color-secondary a-size-base prodDetSectionEntry">
Amazon 売れ筋ランキング
</th>
<td>
<span>

<span> - 104位パソコン・周辺機器 (<a href='/gp/bestsellers/computers/ref=pd_zg_ts_computers'>の売れ筋ランキングを見るパソコン・周辺機器</a>)</span>
<br>

<span> - 6位<a href='/gp/bestsellers/computers/2151978051/ref=pd_zg_hrsr_computers'>マウス</a></span>
<br>

</span>
</td>
</tr>

 想要提取到里面的 “104位パソコン・周辺機器” 。所以尝试找一个特定文本开头的span标签来提取。

我自己写的正则式是:  ^売れ筋ランキング(.*?)$<a 

提取不到想要的内容,请问应该怎么写呢

你想提取什么?

提取 这段内容  “104位パソコン・周辺機器””,要以前面“Amazon 売れ筋ランキング”位定位索引

我写的正则式:let reg = /\<span\> - 104位パソコン・周辺機器/g

用法如下:

let str = "<span> - 104位パソコン・周辺機器 (<a href='/gp/bestsellers/computers/ref=pd_zg_ts_computers'>の売れ筋ランキングを見るパソコン・周辺機器</a>)</span>"

let reg = /\<span\> - 104位パソコン・周辺機器/g

reg.test(str); //true
str.search(reg); // 0

如果要加“以前面“Amazon 売れ筋ランキング”位定位索引”这个条件,建议再弄一个正则式:let reg= /Amazon 売れ筋ランキング/g

用法如下:

let str = '<th class="a-color-secondary a-size-base prodDetSectionEntry">Amazon 売れ筋ランキング</th>';

let reg= /Amazon 売れ筋ランキング/g;

reg.test(str); // true

 

var re1 = new RegExp("<.+?>","g");//匹配html标签的正则表达式,"g"是搜索匹配多个符合的内容
var msg = value.replace(re1,'');//执行替换成空字符
return msg;