Pandas 使用pandas.query()函数中的LIKE
在本文中,我们将介绍在Pandas中如何使用pandas.query()函数中的LIKE操作符来选择数据。
阅读更多:Pandas 教程
Pandas.query()函数
Pandas.query()函数是一种过滤Pandas数据帧(DataFrame)的方式。它的语法类似于SQL查询。可以使用许多运算符,例如,>,<等。
示例 – 使用Pandas.query()函数过滤数据
让我们首先创建一个名为“students”的DataFrame,并将其填充为一组学生姓名、年龄和成绩。然后,让我们使用Pandas.query()函数来仅选择成绩大于80分的学生,并将结果存储在一个名为“ high_scores”的变量中。
import pandas as pd
# 创建 DataFrame
students = pd.DataFrame({
'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [20, 19, 22, 21],
'score': [75, 82, 90, 65]
})
# 使用 Pandas.query() 函数过滤数据
high_scores = students.query('score > 80')
print(high_scores)
输出:
name age score
1 Bob 19 82
2 Charlie 22 90
LIKE操作符
LIKE操作符是用于模式匹配的SQL关键字。在Pandas中,你可以使用LIKE操作符来匹配字符串。如果你想匹配一个模式,你可以使用通配符%。
示例 – 匹配字符串
让我们首先创建一个名为“fruits”的DataFrame,并将其填充为一组水果名称和数量。然后,让我们使用Pandas.query()函数和LIKE操作符来仅选择包含“ban”的水果,并将结果存储在一个名为“ bananas”的变量中。
# 创建 DataFrame
fruits = pd.DataFrame({
'name': ['apple', 'banana', 'orange', 'pineapple'],
'quantity': [3, 6, 2, 1]
})
# 使用 Pandas.query() 函数和 LIKE 操作符过滤数据
bananas = fruits.query("name like '%ban%'")
print(bananas)
输出:
name quantity
1 banana 6
结论
Pandas.query()函数和LIKE操作符是用于过滤Pandas数据帧(DataFrame)的强大工具。使用LIKE操作符,你可以使用通配符来匹配字符串中的模式。在大型数据集中,可以大大减少处理时间。但是,如果使用不当,可能会导致不必要的Io异常。
极客教程