Python Selenium 如何确定下载已完成

在本文中，我们将介绍如何使用Python Selenium来确定下载是否已完成。Selenium是一种用于自动化浏览器操作的强大工具，它可以模拟用户在浏览器中的行为，包括点击、输入和下载文件等。通过对下载行为的控制和监测，我们可以判断下载是否已完成。

阅读更多：Python 教程

使用Selenium下载文件

在使用Selenium进行下载之前，我们需要先设置浏览器的下载路径。可以使用以下代码示例来设置谷歌浏览器的默认下载路径：

from selenium import webdriver
from selenium.webdriver.chrome.options import Options

chrome_options = Options()
chrome_options.add_argument("--headless")  # 在后台运行浏览器
chrome_options.add_argument("--no-sandbox")
chrome_options.add_argument("--disable-dev-shm-usage")
chrome_options.add_experimental_option("prefs", {
    "download.default_directory": r"C:\Downloads",  # 设置下载路径
    "download.prompt_for_download": False,  # 关闭下载时的弹窗
    "download.directory_upgrade": True,
    "safebrowsing.enabled": True
})

driver = webdriver.Chrome(chrome_options=chrome_options)

在上述代码中，我们使用add_experimental_option方法来设置浏览器的下载参数，其中download.default_directory是设置下载路径，download.prompt_for_download可以关闭下载时的弹窗提示。

接下来，我们可以使用Selenium模拟下载行为，例如点击下载按钮：

# 点击下载按钮
download_button = driver.find_element_by_id("download_button")
download_button.click()

监测下载是否已完成

要确定下载是否已完成，我们可以使用WebDriverWait类来等待下载完成的信号。以下是一个示例：

from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By

# 等待下载完成
wait = WebDriverWait(driver, 30)  # 最多等待30秒
# 使用文件名或其他标识符定位下载文件
locator = (By.XPATH, "//td[text()='example_file.txt']")  # 假设要下载的文件名是example_file.txt
wait.until(EC.presence_of_element_located(locator))

在上述示例中，我们使用了WebDriverWait类来等待下载文件出现在页面上。presence_of_element_located方法接受一个定位器（locator），我们可以使用XPath或CSS选择器来定位下载文件的元素。在本例中，我们通过查找包含下载文件名的<td>元素来定位文件。

一旦文件出现在页面上，即表示下载已完成。我们也可以进一步验证下载文件是否成功通过检查文件的大小、检查文件的内容等。