Python Pandas Series.gt()
Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。
Pandas Series.gt()用于比较两个系列,并为每个相应的元素返回布尔值。
语法: Series.gt(other, level=None, fill_value=None, axis=0)
参数:
其他:其他要比较的系列
level: int或在多级的情况下的级别名称。
fill_value:要取代NaN的值
axis: 0或’索引’按行应用方法,1或’列’按列应用。
返回类型:布尔系列
注意:结果是在比较调用者系列>其他系列的基础上返回。
在下面的例子中,所使用的数据框包含一些NBA球员的数据。下面是数据框在任何操作之前的图像。
示例 1:
在这个例子中,年龄列和体重列用.gt()方法进行比较。由于与Age列相比,weight列的值非常大,因此首先将这些值除以10。在比较之前,使用.dropna()方法去除空行以避免错误。
# importing pandas module
import pandas as pd
# importing regex module
import re
# making data frame
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# removing null values to avoid errors
data.dropna(inplace = True)
# other series
other = data["Weight"]/10
# calling method and returning to new column
data["Age > Weight"]= data["Age"].gt(other)
输出:
如输出图片所示,只要Age列的值大于Weight/10,新列就为True。
例子2:处理NaN值
在这个例子中,使用pd.Series()创建了两个系列。该系列也包含空值,因此5被传递给fill_value参数,以用5替换空值。
# importing pandas module
import pandas as pd
# importing numpy module
import numpy as np
# creating series 1
series1 = pd.Series([24, 19, 2, 33, 49, 7, np.nan, 10, np.nan])
# creating series 2
series2 = pd.Series([16, np.nan, 2, 23, 5, 40, np.nan, 0, 9])
# setting null replacement value
na_replace = 5
# calling and storing result
result = series1.gt(series2, fill_value = na_replace)
# display
result
输出:
从输出中可以看出,NaN值被替换为5,替换后进行比较,并使用新值进行比较。
0 True
1 True
2 False
3 True
4 True
5 False
6 False
7 True
8 False
dtype: bool