原创正则表达式中常见的符号和用法

翠林小溪阅读量 142

正则表达式中常见的符号和用法

正则表达式还有很多有用的符号和用法。以下是一些常见的正则表达式元素及其用法:

常用的正则表达式元素

  1. \d: 匹配任何数字,等价于[0-9]
  2. \D: 匹配任何非数字字符,等价于[^0-9]
  3. \w: 匹配任何字母数字字符(包括下划线),等价于[A-Za-z0-9_]
  4. \W: 匹配任何非字母数字字符,等价于[^A-Za-z0-9_]
  5. \s: 匹配任何空白字符(包括空格、制表符、换页符等),等价于[ \t\n\x0b\f\r]
  6. \S: 匹配任何非空白字符,等价于[^ \t\n\x0b\f\r]
  7. .: 匹配除换行符之外的任何单个字符。

常用的正则表达式量词

  1. *: 匹配前面的元素零次或多次。例如,a*匹配空字符串、aaa等。
  2. +: 匹配前面的元素一次或多次。例如,a+匹配aaa等。
  3. ?: 匹配前面的元素零次或一次。例如,a?匹配空字符串或a
  4. {n}: 精确匹配前面的元素n次。例如,a{3}匹配aaa
  5. {n,}: 匹配前面的元素至少n次。例如,a{2,}匹配aaaaa等。
  6. {n,m}: 匹配前面的元素至少n次,但不超过m次。例如,a{2,3}匹配aaaaa

边界匹配

  1. ^: 匹配字符串的开头。例如,^abc匹配以abc开头的字符串。
  2. $: 匹配字符串的结尾。例如,abc$匹配以abc结尾的字符串。
  3. \b: 匹配单词边界。例如,\bword\b匹配整个单词word
  4. \B: 匹配非单词边界。

分组和引用

  1. (): 用于分组。例如,(abc)匹配并捕获abc
  2. |: 或操作符。例如,a|b匹配ab
  3. \1, \2, ...: 引用前面捕获的分组。例如,(\d)\1匹配两个连续的相同数字。

特殊字符转义

  1. \: 用于转义特殊字符。例如,\.匹配一个句点。

示例

  1. 匹配一个电子邮件地址:

    regex 复制代码
    \b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b
  2. 匹配一个IP地址:

    regex 复制代码
    \b\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}\b

综合示例

假设你有一个文本,需要匹配日期格式如2023-05-22

regex 复制代码
\d{4}-\d{2}-\d{2}

这个正则表达式解释如下:

  • \d{4}: 匹配四个数字。
  • -: 匹配一个连字符。
  • \d{2}: 匹配两个数字。
  • -: 匹配一个连字符。
  • \d{2}: 匹配两个数字。

通过掌握这些常见的正则表达式元素和用法,可以处理各种复杂的文本匹配和替换任务。


【部分内容参考自AI】

2
2
2
0/300
全部评论2
0/300