在自己做的案例中,我提供了200个网站链接,然后进行网络抓取,每抓取一个网站就保存一个值,但是最后总有一个网站没有存值,我的分析可能是因为这个网站一直处于链接状态,
有没有什么方法可以判断链接网站的时候,如果超过多少秒还处于链接状态则退出并记录?
from selenium import webdriver
d= webdriver.PhantomJS()
d.set_page_load_timeout(10)
d.set_script_timeout(10)
try:
d.get(s)
except:
d.execute_script('window.stop()')
有啊,官方文档里面有显式等待时长,指定一个等待条件,和一个最长等待时间,程序会判断在等待时间内条件是否满足,如果满足则返回,如果不满足会继续等待,超过时间就会抛出异常。等待条件一般可以设置为dom里面的某个元素、标签等。