Python Pandas Series.str.len()
Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。
Pandas str.len()方法用于确定Pandas系列中每个字符串的长度。这个方法只适用于字符串系列。
因为这是一个字符串方法,所以每次在调用这个方法之前都必须要有.str的前缀。否则就会出现错误。
语法: Series.str.len()
返回类型: 一系列的整数值。根据调用者的系列,可能也会出现NULL值。
在下面的例子中,所使用的数据框包含一些NBA球员的数据。下面是数据框在任何操作之前的图像。
例子#1:计算字符串系列的长度(dtype=str)
在这个例子中,Name列的字符串长度是用str.len()方法计算的。系列的数据类型已经是字符串。所以不需要进行数据类型转换。在做任何操作之前,空行被移除以避免错误。
# importing pandas module
import pandas as pd
# reading csv file from url
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# dropping null value columns to avoid errors
data.dropna(inplace = True)
# creating new column for len
# passing values through str.len()
data["Name Length"]= data["Name"].str.len()
# display
data
输出:
如输出图片所示,返回name列中每个字符串的长度。
注意:
- 这个方法不计算整数或浮点数系列的长度。因为它不是一个字符串系列,所以会出现错误。该系列需要先进行转换(见下例)。
-
没有参数来处理空值。一个空值也会在输出字符串中返回空值。
示例 #2:
在这个例子中,工资列的长度是用str.len()方法计算的。由于该系列被导入为float64 dtype,所以首先使用.astype()方法将其转换为字符串。
# importing pandas module
import pandas as pd
# reading csv file from url
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# dropping null value columns to avoid errors
data.dropna(inplace = True)
# converting to string dtype
data["Salary"]= data["Salary"].astype(str)
# passing values
data["Salary Length"]= data["Salary"].str.len()
# converting back to float dtype
data["Salary"]= data["Salary"].astype(float)
# display
data
输出:
如输出中所示,int或float系列的长度只能通过将其转换为字符串dtype来计算。