Python Pandas Series.str.cat()对字符串进行连接
Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。Pandas就是这些包中的一个,使导入和分析数据变得更加容易。
Pandas str.cat()用于将字符串与传递的调用者系列的字符串连接起来。可以传递不同系列的不同值,但是两个系列的长度必须相同。.str 必须要有前缀,以区别于Python的默认方法。
语法: Series.str.cat(others=None, sep=None, na_rep=None)
参数:
others:系列、索引、数据框架或字符串列表来连接
sep:分隔符要放在两个字符串之间
na_rep:无或字符串值,以取代空值。
返回类型:系列与串联的字符串值。
在下面的例子中,使用的数据框包含一些NBA球员的数据。下面是数据框在任何操作之前的图像。
例子#1:用分隔符串联列
在这个例子中,Team列在Name列的末尾用分隔符”,”连接起来。 Name列被新的系列覆盖,然后显示数据框架。
# importing pandas module
import pandas as pd
# importing csv from link
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# making copy of team column
new = data["Team"].copy()
# concatenating team with name column
# overwriting name column
data["Name"]= data["Name"].str.cat(new, sep =", ")
# display
data
输出:
如输出图片所示,团队列中的每个字符串与姓名列中的字符串具有相同的索引,都被连接到分隔符”,”。
例子#2:处理空值
在分析数据时,最重要的部分是处理空值。str.cat()通过na_rep参数提供了一种处理空值的方法。在每次出现空值时,传递给该参数的内容将被替换。
在这个例子中,大学列和球队列被连接起来。”没有大学 “被传递给na_rep参数,用这个字符串代替null。
# importing pandas module
import pandas as pd
# importing csv from link
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# making copy of team column
new = data["Team"].copy()
# string to replace null values with
na_string ="No College"
# concatenating team with name column
# overwriting name column
data["College"]= data["College"].str.cat(new, sep =", ", na_rep = na_string)
# display
data
输出:
在数据框中可以看到,在索引位置4和5,有一个NULL值,它已经被替换为 “没有学院”,团队列的字符串已经被成功连接。