Python Pandas Series.str.wrap()
Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。
Pandas str.wrap()是处理长文本数据(段落或消息)的一个重要方法。它用于将长文本数据分配到新的行中,或者在超过传递的宽度时处理制表符空间。因为这是一个字符串方法,所以每次在调用这个方法之前都必须要有.str的前缀。
语法: Series.str.wrap(width, **kwargs)
参数:
width: 整数值,定义最大线宽
**kwargs
[可选参数]
expand_tabs:布尔值,如果为真,将制表符扩展为空格。
replace_whitespace:布尔值,如果为真,每个空白字符将被替换为单个空白。
drop_whitespace:布尔值,如果为 “真”,则在新行开始时删除任何空白。
break_long_words:布尔值,如果为 “真”,则断绝比所传递的宽度更长的字。
break_on_hyphens:布尔值,如果为真,当字符串长度小于宽度时,在连字符上断开字符串。
返回类型: 带有分割线/添加字符的系列(‘/n’)
在下面的例子中,所使用的数据框包含一些NBA球员的数据。下面是数据框在任何操作之前的图像。
示例 :
在这个例子中,团队列的行宽为5个字符。因此,每隔5个字符就会放一个n。从新的团队列和旧的团队列中随机抽取一个元素进行打印,以查看工作情况。在应用任何操作之前,使用.dropna()方法将空元素移除。
# importing pandas module
import pandas as pd
# reading csv file from url
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# dropping null value columns to avoid errors
data.dropna(inplace = True)
# display
data["New Team"]= data["Team"].str.wrap(5)
# data frame display
data
# printing same index separately
print(data["Team"][120])
print("------------")
print(data["New Team"][120])
输出:
如输出图片所示,新列每隔5个字符就有’\n’。在打印了相同索引的旧队列和新队列后,可以看到在打印语句中没有添加新行字符,python自动读取了字符串中的’\n’并将其放入新行。
带有新团队列的数据框架-
输出:
Los Angeles Lakers
------------
Los A
ngele
s Lak
ers