Python + Selenium 截图问题

我需要用 Python + Selenium 爬取网页数据，然后截图，我写了如下代码：

from selenium import webdriver

wb = webdriver.Chrome()
wb.get('xxxxxxxxx')
wb.get_screenshot_as_file('screenshot.png')
wb.quit()

但是这个方法只截到当前可见的页面部分，如果数据过多，就需要下拉滚动条，然后再截图，请问怎样才能实现：下拉滚动条至上次没有截到的位置，再截图，直至页面所有数据都截到。

您可以使用 execute_script 方法来模拟滚动操作，将页面滚动到下一屏数据的位置，然后再进行截图。循环执行这个过程，直至页面所有数据都被截取到为止。下面是一个简单的示例代码：

from selenium import webdriver

wb = webdriver.Chrome()
wb.get('xxxxxxxxx')

# 获取页面总高度
js = "return Math.max(document.body.scrollHeight, document.documentElement.scrollHeight, document.body.offsetHeight, document.documentElement.offsetHeight, document.body.clientHeight, document.documentElement.clientHeight);"
total_height = int(wb.execute_script(js))

# 设置截图尺寸
wb.set_window_size(1920, total_height)

# 设置初始滚动位置
scroll_height = 0

while scroll_height < total_height:
    # 模拟滚动操作
    wb.execute_script(f"window.scrollTo(0, {scroll_height});")

    # 等待页面加载
    time.sleep(1)

    # 截图
    wb.save_screenshot(f"screenshot_{scroll_height}.png")

    # 更新滚动位置
    scroll_height += 1080  # 每次滚动 1080 像素高度

wb.quit()

在这个示例中，我首先使用 JavaScript 获取页面的总高度，然后设置窗口大小为全高度。接着，我们循环执行滚动操作，每次滚动一屏高度（这里设置为 1080 像素），然后等待页面加载完成后截图。最后更新滚动位置，直到滚动到页面底部，所有数据都被截取到。注意，为了避免页面未加载完成就截图，我们在每次滚动后等待 1 秒钟，以确保页面加载完成。

你可以看下这个问题的回答https://ask.csdn.net/questions/7672162
这篇博客也不错, 你可以看下python爬虫 selenium动态加载页面中如何控制滚动条逐步滚动
除此之外, 这篇博客: 使用python+selenium超级鹰破解图像识别验证码中的这里补充说明一点因为所有的电脑屏幕大小不同缩放也不一样，所以截图的时候要设置偏移量（不然截图出来不完整），我这里的话我因为懒得计算偏移量了所以我直接在系统里面设置了分辨率为百分百部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:

 code_img=driver.find_element_by_xpath('//div[@class="geetest_widget"]')  #获取验证码位置
        code_imgs=driver.find_element_by_xpath('//div[@class="geetest_widget"]').screenshot_as_png  #截图验证码区域
        chaojiying = Chaojiying_Client('超级鹰账号', '超级鹰密码', '软件id')  # 超级鹰账号
        result=chaojiying.PostPic(code_imgs,9008)['pic_str']
        kk = driver.find_element_by_xpath('//div[@class="geetest_commit_tip"]')  #点击确认按钮

您还可以看一下 CSDN就业班老师的【Python全栈】第十一周 Python网络爬虫进阶实战课程中的 Selenium的使用4小节, 巩固相关知识点