我是新手,请问个小白的问题:
用selenium提取异步加载页面,结果也找不到浏览器里的显示内容是怎么回事?
比如下面这个页面,要获取页面里的关注数量,粉丝数量等资料
from selenium import webdriver
driver = webdriver.Chrome()
driver.get('https://h5.weishi.qq.com/weishi/personal/1546312839098426/wspersonal?_proxy=1&_wv=1&id=1546312839098426')
driver.implicitly_wait(8)
# ttt = driver.find_element_by_css_selector('//div').text
# text = driver.find_element_by_id('app').text
# driver.implicitly_wait(3)
print('结果::::::::::::' + driver.page_source)
这是典型的spa异步加载,需要从dom中获取,page_source是原始源代码,不是ajax加载的。
https://blog.csdn.net/Eastmount/article/details/80088948
谢谢,从其他文章里找到了答案:webdriver爬虫#document问题