Python Pandas Series.str.isalpha()
Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。
Pandas str.isalpha()方法用于检查每个系列的字符串中的所有字符是否为字母(a-z/A-Z)。字符串中出现的空白或任何其他字符将返回false,但如果有一个完整的数字值,那么它将返回NaN。
语法: Series.str.isalpha()
返回类型: 布尔系列,空值也可能被包括在内,这取决于调用者的系列。
在下面的例子中,所使用的数据框包含一些NBA球员的数据。下面是数据框在任何操作之前的图像。
示例 #1:
在这个例子中,isalpha()方法被应用在College列上。在此之前,使用.dropna()方法移除空行以避免错误。
# importing pandas module
import pandas as pd
# making data frame
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# removing null values to avoid errors
data.dropna(inplace = True)
# creating bool series
data["bool_series"]= data["College"].str.isalpha()
# display
data
输出:
如输出图片所示,bool_series可以与College列相匹配,可以清楚地看到,如果字符串只包含字母,就会返回True。
示例 #2:
在这个例子中,isalpha()方法被应用于Name列两次。首先为原来的名字列创建了一个bool系列,之后用str.replace()方法删除了空白,然后再次创建一个新的bool_series。
# importing pandas module
import pandas as pd
# making data frame
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# removing null values to avoid errors
data.dropna(inplace = True)
# creating bool series with original column
data["bool_series1"]= data["Name"].str.isalpha()
# removing white spaces
data["Name"]= data["Name"].str.replace(" ", "")
# creating bool series with new column
data["bool_series2"]= data["Name"].str.isalpha()
# display
data.head(10)
输出:
如输出图片所示,在字符串有空格之前,Bool系列的所有值都是假的。在去除空白后,只有在字符串有特殊字符的地方,Bool系列才是假的。