几乎所有有用的程序都会涉及到某些文本处理,不管是解析数据还是产生输出。 这一章将重点关注文本的操作处理,比如提取字符串,搜索,替换以及解析等。 大部分的问题都能简单的调用字符串的内建方法完成。 但是,一些更为复杂的操作可能需要正则表达式或者强大的解析器,所有这些主题我们都会详细讲解。 并且在操作Unicode时候碰到的一些棘手的问题在这里也会被提及到。
- 使用多个界定符分割字符串
- 字符串开头或结尾匹配
- 用Shell通配符匹配字符串
- 字符串匹配和搜索
- 字符串搜索和替换
- 字符串忽略大小写的搜索替换
- 最短匹配模式
- 多行匹配模式
- 将Unicode文本标准化
- 在正则式中使用Unicode
- 删除字符串中不需要的字符
- 审查清理文本字符串
- 字符串对齐
- 合并拼接字符串
- 字符串中插入变量
- 以指定列宽格式化字符串
- 在字符串中处理html和xml
- 字符串令牌解析
- 实现一个简单的递归下降分析器
- 字节字符串上的字符串操作