Pandas – DataFrame.isin()
Python是一种做数据分析的伟大语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。 Pandas 是这些软件包之一,使导入和分析数据更加容易。
Pandas isin()方法用于过滤数据框架。isin()方法有助于选择在特定列中具有特定(或多个)值的行
语法: DataFrame.isin(values)
参数:
values: iterable, Series, List, Tuple, DataFrame或字典,以检查调用者的Series/Data Frame.返回值:布尔值的DataFrame。
例子#1:单参数过滤
在下面的例子中,行被检查并返回一个布尔值系列,即Gender=”Male “的地方为真。然后,该系列被传递给DataFrame,以看到新的过滤DataFrame。
# importing pandas package
import pandas as pd
# making data frame from csv file
data = pd.read_csv("employees.csv")
# creating a bool series from isin()
new = data["Gender"].isin(["Male"])
# displaying data with gender = male only
data[new]
输出:
如输出图片所示,只有性别=”男性 “的行被返回。
例子#2:多参数过滤
在下面的例子中,DataFrame是根据性别和团队来过滤的。Gender=”Female “和Team=”Engineering”, “Distribution “或 “Finance”的行被返回。
# importing pandas package
import pandas as pd
# making data frame from csv file
data = pd.read_csv("employees.csv")
# creating filters of bool series from isin()
filter1 = data["Gender"].isin(["Female"])
filter2 = data["Team"].isin(["Engineering", "Distribution", "Finance" ])
# displaying data with both filter applied and mandatory
data[filter1 & filter2]
输出:
如输出图片所示,返回的行有Gender=”Female “和Team=”Engineering”, “Distribution “或 “Finance”。