Python Pandas Series.str.slice_replace()
Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。
Pandas str.slice_replace()方法用于替换Pandas系列对象中存在的一个切片字符串。因为这是一个Pandas字符串方法,所以每次在调用这个方法之前,都要把.str作为前缀。否则,会产生错误。
语法: Series.str.slice_replace(start=None, stop=None, repl=None)
参数:
start: int值,告诉你从哪里开始切片。
stop: int值,告诉你在哪里结束切片。
repl: 字符串值,用这个替换切片的子串
返回类型: 带替换值的系列
在下面的例子中,所使用的数据框包含一些NBA球员的数据。下面是数据框在任何操作之前的图像。
示例 :
在这个例子中,工资列已经被切片,以获得小数点后的数值,这些数值(’.0’被’$’符号取代)。由于工资列被导入为float64数据类型,所以首先使用.astype()方法将其转换为字符串。
# importing pandas module
import pandas as pd
# making data frame
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# removing null values to avoid errors
data.dropna(inplace = True)
# start stop and step variables
start, repl = -2, '$'
# converting to string data type
data["Salary"]= data["Salary"].astype(str)
# slicing till 2nd last element
data["Salary New"]= data["Salary"].str.slice_replace(start = start, repl = repl)
# display
data.head(10)
输出:
如输出图片所示,薪资新列的数值被替换。使用.slice_replace()方法,”.0 “已被”$”取代。