Python – 用Pandas.query()方法过滤数据
Pandas是一个被广泛使用的Python库,用于数据清洗、数据分析等领域。在本文中,我们将看到如何使用query方法从给定的数据集中获取特定数据。我们可以在查询中使用单个或多个条件。
读取数据
让我们首先使用Pandas库将数据读入Pandas数据框架中。下面的程序就是完成这项工作的。
示例
import pandas as pd
#从csv文件中读取数据帧
data = pd.read_csv("D:\heart.csv")
print(data)
输出
运行以上代码会得到以下结果-

单一条件查询
下面我们看看如何使用query方法进行单一条件查询。正如您所看到的,只有原始数据集中的119行被返回为结果。
示例
import pandas as pd
#从csv文件中读取数据帧
data = pd.read_csv("D:\heart.csv")
data.query('chol < 230', inplace=True)
#结果
print(data)
输出
运行以上代码会得到以下结果-

多条件查询
与上述方法类似,我们可以将多个条件应用于查询方法,以进一步限制结果数据集。现在,当我们还限制年龄大于60时,只有79行被返回。
示例
import pandas as pd
#从csv文件中读取数据帧
data = pd.read_csv("D:\heart.csv")
data.query('chol < 230' and 'age > 60', inplace=True)
#结果
print(data)
输出
运行以上代码会得到以下结果-

极客教程