Python Pandas Series.str.len()

Python Pandas Series.str.len()

Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。

Pandas str.len()方法用于确定Pandas系列中每个字符串的长度。这个方法只适用于字符串系列。
因为这是一个字符串方法,所以每次在调用这个方法之前都必须要有.str的前缀。否则就会出现错误。

语法: Series.str.len()

返回类型: 一系列的整数值。根据调用者的系列,可能也会出现NULL值。

在下面的例子中,所使用的数据框包含一些NBA球员的数据。下面是数据框在任何操作之前的图像。
Python Pandas Series.str.len()

例子#1:计算字符串系列的长度(dtype=str)

在这个例子中,Name列的字符串长度是用str.len()方法计算的。系列的数据类型已经是字符串。所以不需要进行数据类型转换。在做任何操作之前,空行被移除以避免错误。

# importing pandas module 
import pandas as pd
  
# reading csv file from url 
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
   
# dropping null value columns to avoid errors
data.dropna(inplace = True)
  
# creating new column for len
# passing values through str.len()
data["Name Length"]= data["Name"].str.len()
  
# display
data

输出:
如输出图片所示,返回name列中每个字符串的长度。
Python Pandas Series.str.len()

注意:

  • 这个方法不计算整数或浮点数系列的长度。因为它不是一个字符串系列,所以会出现错误。该系列需要先进行转换(见下例)。

  • 没有参数来处理空值。一个空值也会在输出字符串中返回空值。

示例 #2:
在这个例子中,工资列的长度是用str.len()方法计算的。由于该系列被导入为float64 dtype,所以首先使用.astype()方法将其转换为字符串。

# importing pandas module 
import pandas as pd
  
# reading csv file from url 
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
   
# dropping null value columns to avoid errors
data.dropna(inplace = True)
  
# converting to string dtype
data["Salary"]= data["Salary"].astype(str)
  
# passing values
data["Salary Length"]= data["Salary"].str.len()
  
# converting back to float dtype
data["Salary"]= data["Salary"].astype(float)
  
# display
data

输出:
如输出中所示,int或float系列的长度只能通过将其转换为字符串dtype来计算。
Python Pandas Series.str.len()

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程