实际的网页url时这样的http://www.mof.gov.cn/xinwenlianbo/shanxicaizhengxinxilianbo/201901/t20190128_3134160.htm
但是在网页上是这样的《a href = ../../xinwenlianbo/shanxicaizhengxinxilianbo/201901/t20190128_3134160.htm》 ABCD 《a》
里面为什么会出现那两个杠杠和点点呀?要怎么补全呢?有很多的链接都是这个样子,出现了杠杠和点点,前面的部分还不太一样,这种情况要怎么处理呢?求指教!
上面是尖括号,因为尖括号敲上去之后不显示标签对里面的信息,不得已改成了书名号=。=
../../xinwenlianbo/shanxicaizhengxinxilianbo/201901/t20190128_3134160.htm 这个链接点击要是可以进去的话,就可以在代码里面添加这个链接前面的那些字符,我觉得你这个链接前面手动添加的字符应该就是http://www.mof.gov.cn几个字母
萌新一枚,不对勿喷。
出现..应该是相对路径的原因,爬取的时候应该可以在代码的某一处(深度爬取执行之前)手动加上网站主目录URL。