Python – 有限制的搜索
经常情况下,当我们得到一个搜索结果之后,我们需要搜索现有搜索结果的更深层次。例如,在给定的文本体中,我们旨在获取网址并提取网址的不同部分,例如协议、域名等。在这种情况下,我们需要使用 group 函数,该函数用于将搜索结果分成不同的组,这些组基于分配的正则表达式。我们通过在可搜索部分周围使用括号来分离主要的搜索结果,并排除我们想要匹配的固定单词来创建这样的组表达式。
import re
text = "The web address is https://www.tutorialspoint.com"
# Taking "://" and "." to separate the groups
result = re.search('([\w.-]+)://([\w.-]+)\.([\w.-]+)', text)
if result :
print "The main web Address: ",result.group()
print "The protocol: ",result.group(1)
print "The domain name: ",result.group(2)
print "The TLD: ",result.group(3)
当我们运行以上程序时,我们得到以下输出 –
The main web Address: https://www.tutorialspoint.com
The protocol: https
The domain name: www.tutorialspoint
The TLD: com