Python Pandas Series.lt()
Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。
Pandas Series.lt()用于比较两个系列,并为每个相应的元素返回布尔值。
语法: Series.lt(other, level=None, fill_value=None, axis=0)
参数:
other:要与之比较的其他系列
level: int或者在多级的情况下,级别的名称。
fill_value。要替换的值,而不是NaN
axis:0或’index’用于按行应用方法,1或’columns’用于按列应用。
返回类型: 布尔系列
注意:结果是在比较调用者系列<其他系列的基础上返回的。
要下载以下例子中使用的数据集,请点击这里。
在下面的例子中,所使用的数据框包含一些NBA球员的数据。下面是数据框在任何操作之前的图像。
示例 #1:
在这个例子中,年龄列和体重列用.lt()方法进行比较。由于与Age列相比,weight列的值非常大,因此首先将这些值除以10。在比较之前,使用.dropna()方法去除空行以避免错误。
# importing pandas module
import pandas as pd
# making data frame
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# removing null values to avoid errors
data.dropna(inplace = True)
# other series
other = data["Weight"]/10
# calling method and returning to new column
data["Age < Weight"]= data["Age"].lt(other)
# display
data
输出:
如输出图片所示,只要Age列的值小于Weight/10,新列就为True。
例子#2:处理NaN值
在这个例子中,使用pd.Series()创建了两个系列。该系列也包含空值,因此10被传递给fill_value参数,以用10替换空值。
# importing pandas module
import pandas as pd
# importing numpy module
import numpy as np
# creating series 1
series1 = pd.Series([11, 21, 2, 43, 9, 27, np.nan, 110, np.nan])
# creating series 2
series2 = pd.Series([16, np.nan, 2, 23, 5, 40, np.nan, 0, 19])
# setting null replacement value
na_replace = 10
# calling and storing result
result = series1.lt(series2, fill_value = na_replace)
# display
result
输出:
从输出中可以看出,NaN值被替换为5,替换后进行比较,并使用新值进行比较。
0 True
1 False
2 False
3 False
4 False
5 True
6 False
7 False
8 True
dtype: bool