Python Pandas Series.clip()
Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。
Python Series.clip()用于在传递的最小值和最大值的下方和上方剪辑数值。在进行信号处理等操作时,这个方法会派上用场。正如我们所知,数字信号中只有两个值,要么是高值,要么是低值。Pandas Series.clip()可以用来将数值限制在一个特定范围内。
语法: Series.clip(lower=None, upper=None, axis=None, inplace=False)
参数:
lower: 设定范围内的最小值。任何低于此值的值都等于低值。
upper:设置范围的最大值。任何高于此的值都等于上限。
axis:0或’index’表示按行应用方法,1或’columns’表示按列应用方法。
inplace:在调用者系列本身进行修改。(用新值覆盖)
返回类型。带有更新值的系列
在下面的例子中,所使用的数据框包含一些NBA球员的数据。下面是数据框在任何操作之前的图像。
示例
在这个例子中,.clip()方法被调用到Age列的数据上。一个最小值22被传递到下参数,25被传递到上参数。返回的序列被存储在一个新的列 “New Age “中。在进行任何操作之前,使用.dropna()方法删除空行以避免错误。
# importing pandas module
import pandas as pd
# importing regex module
import re
# making data frame
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# removing null values to avoid errors
data.dropna(inplace = True)
# lower value of range
lower = 22
# upper value of range
upper = 25
# passing values to new column
data["New Age"]= data["Age"].clip(lower = lower, upper = upper)
# display
data
输出:
如输出图像所示,新时代列的最小值为22,最大值为25。所有的值都被限制在这个范围内。低于22的值被定为等于22,高于25的值被定为等于25。