关于网页切换后的获取信息的问题

我用python爬取一些公开的文件,公开文件有提供的下载,这里有2种形式:一种是点击下载附件后切换到pdf文件(新建一个标签),并没有下载,第二种是点击下载附件后直接下载,不切换到pdf文件。其实这两种通过webdriver定位到附件下载click()后都能直接下载(用的chromedriver),但是我还是想针对第一种情况切换到第二个标签(switch_to.windows[1]),然后获取标签title或current_url,但是切换后运行driver.title或driver.current_url均提示超时300秒。我想可能是因为pdf文件太大,根本加载不上,也就没法获得相应内容了。那么此时我能对第二个标签做些什么呢,哪怕获取一点点信息也行啊,我就是想判断一下第二个标签是个PDF文档而已。谢谢!

获得到文件链接地址后,可以用 head 方式请求,这样用时很少,根据响应头可以得到文件信息和文件类型,用 content-type 和文件名来确定文件类型即可,content-length 则是文件大小,另外,可以直接用二进制方式保存,可以直接下载文件,自行设定超时限制即可