selenium操作edge浏览器下载文件

使用selenium操作edge浏览器在正常模式下可以下载文件但是使用headless无头模式下载就不成功是需要额外配置什么参数吗

下载文件，不需要浏览器，可以试着改用requests库去实现。

【以下回答由 GPT 生成】

回答:

在Selenium中，无头模式默认是禁止文件下载的，因此需要额外配置一些参数才能在无头模式下完成文件下载操作。以下是解决该问题的具体步骤：

首先，确保你已经安装了Selenium和Edge浏览器的WebDriver，并将其加入系统的环境变量中。
导入必要的库：

from selenium import webdriver
from selenium.webdriver.edge.options import Options

创建Edge浏览器的Options对象，并设置无头模式和禁止图片加载：

options = Options()
options.add_argument("--headless")
options.add_argument("--disable-gpu")
options.add_argument("--disable-extensions")
options.add_experimental_option("prefs", {"profile.default_content_setting_values.automatic_downloads": 1,
                                          "profile.default_content_setting_values.notifications": 1,
                                          "profile.default_content_setting_values.popups": 1})

创建Edge浏览器的WebDriver实例，并传入Options对象：

driver = webdriver.Edge(options=options)

进行其他的操作，比如导航到下载链接：

driver.get("https://example.com/download/file")

下载文件时，使用WebDriver的execute_script方法执行JavaScript代码，模拟点击下载按钮：

driver.execute_script("arguments[0].click();", download_button)

这里的download_button是下载按钮的元素对象。

等待文件下载完成，可以通过判断文件是否存在来确认下载完成：

import os

file_path = "/path/to/download/directory/file.zip"
while not os.path.exists(file_path):
    time.sleep(1)

以上就是在无头模式下使用Selenium和Edge浏览器进行文件下载的解决方案。如果你按照以上步骤操作仍然无法成功下载文件，则可能是由于Edge浏览器本身的限制或其他问题导致的。此时，建议尝试使用其他浏览器或与Edge浏览器的开发者社区联系以获取更多的支持。

【相关推荐】

你可以参考下这个问题的回答, 看看是否对你有帮助, 链接: https://ask.csdn.net/questions/7417857
您还可以看一下路飞老师的自动化工具selenium快速入门+项目实战课程中的 selenium简介小节, 巩固相关知识点

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^

文件下载需要加上等待时间，或许你可以加上一段检查文件是否下载完成的代码

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.options import Options
import os
import time

# 设置Edge WebDriver的路径
edge_driver_path = "path_to_your_edge_webdriver.exe"

# 创建Edge WebDriver实例并配置无头模式
options = webdriver.EdgeOptions()
options.headless = True
options.add_argument('--disable-gpu')  # 如果有必要，禁用GPU加速

# 创建Edge浏览器实例
driver = webdriver.Edge(executable_path=edge_driver_path, options=options)

# 打开网页
driver.get("https://example.com")  # 替换成您要访问的网址

# 执行下载操作，例如点击一个下载链接
download_link = driver.find_element(By.XPATH, "//a[@id='download-link']")  # 替换成您网页上的下载链接
download_link.click()

# 等待一段时间以确保文件下载完成（根据文件大小和网络速度调整等待时间）
wait_time = 60  # 最多等待60秒
downloaded_file_path = "/path/to/your/downloaded/file.pdf"  # 替换成您期望的下载文件路径

while wait_time > 0:
    if os.path.exists(downloaded_file_path) and os.path.getsize(downloaded_file_path) > 0:
        print("文件下载成功！")
        break
    time.sleep(1)  # 每秒检查一次
    wait_time -= 1

if wait_time <= 0:
    print("文件下载超时或失败。")

# 关闭浏览器
driver.quit()