BeautifulSoup 获取BeautifulSoup结果中的”action”属性

在本文中，我们将介绍如何使用BeautifulSoup库来获取一个HTML文档中不同标签中的”action”属性。BeautifulSoup是一个Python库，用于从HTML或XML文件中提取数据。它可以帮助我们解析、遍历和修改HTML标签。

阅读更多：BeautifulSoup 教程

什么是”action”属性？

在HTML中，表单标签（

form>）通常用于向服务器发送数据。当用户提交表单时，表单数据将会被发送到服务器上指定的URL，这个URL就是表单的”action”属性。

“action”属性是表单标签中的一个属性，用于指定表单数据提交的目标URL。它可以是相对URL（相对于当前页面的URL）或绝对URL（完整的URL地址）。

为了演示如何获取”action”属性，我们将使用一个简单的HTML表单作为示例：

<html>
<body>
    <form action="/submit" method="post">
        <input type="text" name="name">
        <input type="submit" value="Submit">
    </form>
</body>
</html>

在上面的示例中，表单标签的”action”属性设置为”/submit”，表示表单数据将会被提交到服务器上的”/submit”路径。

使用BeautifulSoup获取”action”属性

首先，我们需要安装BeautifulSoup库。在终端或命令行中运行以下命令：

pip install beautifulsoup4

安装完成后，我们可以开始编写代码来获取”action”属性。

首先，导入必要的库：

from bs4 import BeautifulSoup

接下来，读取HTML文件并使用BeautifulSoup解析：

with open("example.html") as file:
    soup = BeautifulSoup(file, "html.parser")

现在，我们可以使用BeautifulSoup的各种方法来获取”action”属性了。

方法一：使用标签选择器（CSS选择器）

可以使用select_one()方法来选择表单标签，并使用get()方法来获取”action”属性的值：

form_tag = soup.select_one("form")
action = form_tag.get("action")
print(action)

上述代码中，我们使用select_one()方法选择第一个表单标签，并调用get()方法获取”action”属性的值。最后，将结果打印出来。

方法二：使用find()方法

可以使用find()方法来查找具有指定属性的表单标签，并获取”action”属性的值：

form_tag = soup.find("form")
action = form_tag.get("action")
print(action)

上述代码中，我们使用find()方法查找第一个表单标签，并调用get()方法获取”action”属性的值。

无论是使用标签选择器还是find()方法，我们都可以得到同样的结果。

示例

假设我们有一个名为”example.html”的HTML文件，其内容如下：

<html>
<body>
    <form action="/submit" method="post">
        <input type="text" name="name">
        <input type="submit" value="Submit">
    </form>
</body>
</html>

现在，我们将使用上述代码来获取”action”属性：

from bs4 import BeautifulSoup

with open("example.html") as file:
    soup = BeautifulSoup(file, "html.parser")

# 使用标签选择器（CSS选择器）
form_tag = soup.select_one("form")
action = form_tag.get("action")
print(action)

# 使用find()方法
form_tag = soup.find("form")
action = form_tag.get("action")
print(action)

运行上述代码，我们将得到以下输出：