如何在Python中使用正则表达式匹配空格

如何在Python中使用正则表达式匹配空格

正则表达式,通常被称为RegEx,是一个由字符组成的字符串,对应于文本字符串中的字母、单词或字符模式。这意味着您可以使用正则表达式来匹配和检索文本中的任何字符串模式。搜索和替换过程受益于使用正则表达式。最常见的应用是搜索与模式匹配的子字符串,并用其他内容进行替换。

什么是空格字符?

“空白格”指任何表示水平或垂直空间的字母或字符集。使用正则表达式,“\s”元字符可以在Python中匹配空格字符。

算法

  • 导入re函数库

  • 初始化字符串。

  • 在Python中使用元字符 “\s” 进行匹配。

  • 使用findall方法、“\s”元字符和字符串作为参数。

  • 输出匹配的空格。

语法

result = re.findall(r'[\s]', str)
**re.findall():** 返回字符串中模式的所有不重叠匹配项,作为字符串列表。字符串从左到右扫描,匹配项按找到的顺序返回。

regx = re.compile('\W')
**re.compile():** 我们可以将一个正则表达式编译成一个正则对象,以在多个目标字符串中查找相同模式的出现,而无需重写它。

result = regx.findall(str)
re模块提供了一系列方法,让我们可以在字符串中查找匹配项:

findall:返回所有匹配项的列表。
split:返回一个将字符串在每个匹配处拆分的列表。
sub:用一个或多个匹配项替换一个字符串。
Bash
  • 搜索 — 如果字符串中存在匹配项,则返回一个 Match 对象。

示例 1:如何在Python中匹配空格

#导入 re 函数
import re
#初始化字符串 str
str= 'The Psychology of Money.'
#将 findall 方法的返回值存储到变量 result 中
result = re.findall(r'[\s]', str)
#打印输出结果
print('给定的字符串为 \n',str)
print('它包含',len(result),'个空格')
print (result)
Bash

输出

上述代码中的字符串有3个空格。同样地,以下是上述命令的输出:

('给定的字符串为 \n', 'The Psychology of Money.')
('它包含', 3, '个空格')
[' ', ' ', ' ']
Bash

代码解释

我们导入re模块来开始使用正则表达式匹配空格。下一步是用我们要匹配的字符串初始化变量“str”。使用元字符“\s”在Python中检查空格使用RegEx。

一个名为“result”的变量存储python函数findall()的结果。该函数搜索整个文本,查找模式出现的所有实例。它需要两个参数,元字符“[\s]”和字符串“str”。最后一步是将结果作为输出打印出来。

示例

#引入 re 函数
import re
#初始化字符串 str
str= "诚实是最好的策略。"
#将 findall 方法的值存储在变量 result 中
result = re.findall(r'[\s]', str)
#打印结果
print('给定的字符串为 \n',str)
print('它有',len(result),'个空格')
print (result)
Bash

输出

上述代码中的字符串有 4 个空格。同样,以下为上述命令的输出 −

('给定的字符串为 \n', '诚实是最好的策略。')
('它有', 4, '个空格')
[' ', ' ', ' ', ' ']
Bash

示例

#引入 re 函数
import re
#从用户处读取输入并存储在字符串 str 中
str= '诚实是最好的策略'
#初始化 regex,它将编译所有匹配的单词字符
regx = re.compile('\W')
#将 findall 方法的值存储在变量 result 中
result = regx.findall(str)
#打印结果
print('给定的字符串为 \n',str)
print('它有',len(result),'个空格')
print (result)
Bash

输出

上述命令的输出如下 −

('给定的字符串为 \n', '诚实是最好的策略')
('它有', 4, '个空格')
[' ', ' ', ' ', ' ']
Bash

代码解释

我们加载 re 模块以开始在 Python 中使用正则表达式来匹配空格。下一步是要求用户提供一个包含我们希望匹配的空格的字符串输入。在 Python 中使用 RegEx 时,元字符 "s" 用于匹配空格。

Python 方法 findall 存储在名为 "result" 的变量中()。此方法在文本中查找模式的每个实例。它需要元字符 "[\s]" 和字符串 "str" 作为两个参数。输出返回用户给定字符串中存在的空格。

结论

正则表达式是专门的文本字符串,提供搜索模式。它们是表示文本字符串中某些字母、单词或字符组合的字符序列。re 模块用于处理正则表达式。在 Python 中使用正则表达式匹配空格的元字符是 ‘\s’。

RegEx 中最常用的函数是 findall()、search()、split() 和 sub()。锚点、字符集和修饰符是正则表达式结构的关键组件。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册