正则表达式替换,简单的文本替换操作用不着正则表达式,比如说,把所有的 CA 替换成 California,用正则表达式来完成未免大材小用了。当用到反向引用时,正则表达式的操作才会变得让人印象深刻。
如下所示,通过正则表达式找出文本中的邮件地址:
文本
Hello, ben@forta.com is my email address.
正则表达式
\w+[\w\.]*@[\w\.]+\.\w+
运行结果
如果想把文本中的电子邮件地址全部转换成可以点击的链接,该怎么办呢? 在 HTML中,你需要使用<a href=“mailroom:user@address.com”>user@address.com</a>
这样的语法来创建一个可以点击的电子邮件地址。如下所示:
文本
Hello, ben@forta.com is my email address.
正则表达式
(\w+[\w\.]*@[\w\.]+\.\w+)
替换
<a href=“mailto:1”>1</a>
运行结果
替换操作需要用到两个正则表达式:一个用来指定搜索模式,另一个用来指定替换模式。反向引用可以跨模式使用,在第一个模式里匹配的子表达式可以用在第二个模式里。上例中,子表达式(\w+[\w\.]*@[\w\.]+\.\w+)
的运行结果ben@forta.com
就可以运用在替换模式中,替换$1
对应的内容。
再来看一个例子,在一个保存用户信息的数据库里,电话号码的保存格式为 313-555-1234
,现在你需要把电话号码的格式重新调整为(313) 555-1234
,如下所示:
文本
313-555-1234
248-555-9999
810-555-9000
正则表达式
(\d{3})(-)(\d{3})(-)(\d{4})
替换
(1)3-$5
运行结果
提示:在调整文本格式的时候,把文本分解成多个子表达式的做法往往非常有用,这样可以更精细地控制文本。
极客教程相关文章推荐,欢迎阅读!
正则表达式子表达式
正则表达式匹配数字范围
正则表达式回溯法
正则表达式重复匹配
正则表达式元字符