关于Python爬链家的租房面积数据, 在开发者模式下面积数据间隔改变位置,且文本不在标签内,如下图
在一番查找下找不出解决办法,请问如何用xpath获取面积数据
原来的xpath路径是写成.xpath('normalize-space(./p[@class="content__list--item--des"]/text()[5])').extract()的,但是面积数据并不固定在5
写成这样吧!它的这面积好像都是倒数第三个的位置
//p[@class="content__list--item--des"]/text()[last()-3]
稍微处理一下,就能把所有一级的放在一起,还可以单独取出面积
name=res.html.xpath('//*[@class="content__list--item--des"]')
data=[]
for i in name:
dd=[]
d=i.xpath('.//text()')
for n,j in enumerate(d):
if j!='\n' and j!='-' and j!='/':
dd.append(d[n].strip())
print(dd)
for k in dd:
if '㎡' in k:
print(k)
data.append(dd)