如何使用Python正则表达式从HTML链接中提取URL?
下面的代码使用Python正则表达式从HTML链接中提取URL。
更多Python相关文章,请阅读:Python 教程
示例
import re
s = '''[](http://www.santa.com)<http://www.santa.com>'''
match = re.search(r'href=[\'"]?([^\'" >]+)', s)
if match:
print match.group(0)
输出
这将输出:
href="http://www.santa.com"
极客教程