第1章 正则表达式
1.1 简介/动机
操作文本或者数据可是件大事。如果不相信,就仔细看看如今的计算机在做些什么工作:文字处理、网页表单的填写、来自数据库转储信息流、股票报价信息、新闻源,而且这个清单还会不断增长。因为我们可能还不知道需要用计算机编程来处理的文本或数据的具体内容,所以能将这些文本或者数据以某种可被计算机识别和处理模式表达出来是非常有用的。
如何通过编程使计算机具有在文本中检索某种模式的能力。正则表达式为高级的文本模式匹配、抽取、与/或文本形式的搜索和替换功能提供了基础。简单地说,正则表达式(简称regex)是一些由字符和特殊符号组成的字符串。它们描述了模式的重复或者表述多个字符,于是正则表达式能按照某种模式匹配一系列有相似特征的字符串。换句话来说,它们能够匹配多个字符串。