<tr>
<th class="a-color-secondary a-size-base prodDetSectionEntry">
Amazon 売れ筋ランキング
</th>
<td>
<span>
<span> - 104位パソコン・周辺機器 (<a href='/gp/bestsellers/computers/ref=pd_zg_ts_computers'>の売れ筋ランキングを見るパソコン・周辺機器</a>)</span>
<br>
<span> - 6位<a href='/gp/bestsellers/computers/2151978051/ref=pd_zg_hrsr_computers'>マウス</a></span>
<br>
</span>
</td>
</tr>
想要提取到里面的 “104位パソコン・周辺機器” 。所以尝试找一个特定文本开头的span标签来提取。
我自己写的正则式是: ^売れ筋ランキング(.*?)$<a
提取不到想要的内容,请问应该怎么写呢
你想提取什么?
提取 这段内容 “104位パソコン・周辺機器””,要以前面“Amazon 売れ筋ランキング”位定位索引
我写的正则式:let reg = /\<span\> - 104位パソコン・周辺機器/g
用法如下:
let str = "<span> - 104位パソコン・周辺機器 (<a href='/gp/bestsellers/computers/ref=pd_zg_ts_computers'>の売れ筋ランキングを見るパソコン・周辺機器</a>)</span>"
let reg = /\<span\> - 104位パソコン・周辺機器/g
reg.test(str); //true
str.search(reg); // 0
如果要加“以前面“Amazon 売れ筋ランキング”位定位索引”这个条件,建议再弄一个正则式:let reg= /Amazon 売れ筋ランキング/g
用法如下:
let str = '<th class="a-color-secondary a-size-base prodDetSectionEntry">Amazon 売れ筋ランキング</th>';
let reg= /Amazon 売れ筋ランキング/g;
reg.test(str); // true
var re1 = new RegExp("<.+?>","g");//匹配html标签的正则表达式,"g"是搜索匹配多个符合的内容
var msg = value.replace(re1,'');//执行替换成空字符
return msg;