Python 约束搜索
许多时候,当我们获得搜索结果后,我们还需要在现有的搜索结果中进一步搜索。例如,在给定的文本中,我们的目标是获取网址,并提取网址的不同部分,如协议、域名等。在这种情况下,我们需要使用group函数来将搜索结果根据所指定的正则表达式分成不同的组。我们通过在可搜索部分周围使用括号,排除我们想要匹配的固定词来创建这样的组表达式。
import re
text = "The web address is https://www.tutorialspoint.com"
# Taking "://" and "." to separate the groups
result = re.search('([\w.-]+)://([\w.-]+)\.([\w.-]+)', text)
if result :
print "The main web Address: ",result.group()
print "The protocol: ",result.group(1)
print "The doman name: ",result.group(2)
print "The TLD: ",result.group(3)
当我们运行上面的程序时,我们会得到以下输出−
The main web Address: https://www.tutorialspoint.com
The protocol: https
The doman name: www.tutorialspoint
The TLD: com