使用Regex从Dataframe的指定列中提取标点符号
在这篇文章中,我们将看到如何使用Regex提取数据框架指定列中使用的标点符号。
首先,我们正在制作包含所有标点符号的正则表达式。[!”\$%&\'()+,\-.\/:;=#@?[\\\]^_`{|}~] 然后我们将特定列的每一行传递给re.findall()函数以提取标点符号,然后将提取的标点符号分配给数据框架的新列。
re.findall()函数用于提取****,作为一个字符串的列表,所有不重叠的模式匹配。字符串被从左到右扫描,并按照找到的顺序返回匹配的字符串。
语法: re.findall(regex, string)
返回:字符串中模式的所有非重叠匹配,作为一个字符串的列表。
现在,让我们创建一个数据框架。
输出:
现在,从列注释中提取标点符号。
输出: