正则表达式

参考文档

正则表达式,又称为规则表达式(Regular Expression),通常可以缩写成regexregexpregexpsregexesRE

正则表达式的发展历史

  • 美国两位神经生理科学家Warren McCullochWalter Pitts研究出了一种用数学方式描述神经网络的方法,该方法将神经系统中的神经元描述成了小而简单的自动控制元
  • 1951年,科学家Stephen Kleene在上述研究的基础上发表了《神经网事件的表示法》的论文,该论文引入了正则表达式的概念,将上述的数学控制元称为正则集合的数学符号
  • Unix之父Ken Thompson将正则表达式的研究成果应用到计算搜索算法中,将此符号系统引入到编辑器QED以及grep
  • 在之后的几十年里,正则表达式的思想被广泛应用到主流操作系统工具(类UnixWindows)、主流开发语言(perlc++pythonJavaScript)等各种应用领域中

正则表达式应用场景:文本处理

  • 通过模式进行文本搜索
  • 通过模式进行文本替换

接下来将从以下四个方面介绍正则表达式

  • 语法:正则表达式的组成成分(字符和元字符)
  • 引擎:正则表达式的工作原理(模式匹配)
  • 工具:正则表达式的编写和测试工具
  • 应用:正则表达式的常见应用