正则表达式语法:
1、普通字符:主要包括文字字符、符号(@、%、_等);直接写。
非打印字符 | 说明 |
---|
\n | 换行符 |
\r | 回车符 |
\f | 换页符 |
\t | 制表符 |
\v | 垂直制表符 |
其他字符 | 说明 |
---|
\x00 | 16进制转义值 |
\000 | 8进制转义值 |
\u00000 | unicode编码值 |
...... | ...... |
2、字符集合:**单个关键字**的值范围,包含在[]中
例:[a-z]、[abc]、[0-9]、[A-Z]
g[eo]t可以匹配到get、got,但geot不能匹配上
注:若在字符集合中“-”也参与匹配,则需要转义,例[a\-b]
注:设置字符集合为排除在外的值范围,使用^符号
3、限定符:为**前一个字符**追加出现次数的范围
注:使用{}来标注具体次数
—— {3} 表示出现3次
—— {3,} 表示出现3次或以上
—— {3,6} 表示出现3-6次
注:限定符前面为字符集合,可分为**贪婪匹配**和**非贪婪匹配**
—— gadxxgod为例
——g[a-z]+d 贪婪匹配会匹配到尽可能多的字符(gadxxgod)
——g[a-z]+?d 加入?为非贪婪匹配(gad god)
常用限定符 | 说明 |
---|
* | 出现0次或多次 {0,} |
+ | 出现1次或多次 {1,} |
? | 出现0次或1次 {0,1} |
4、定位符:标记匹配位置的元字符
定位符 | 说明 |
---|
^ | 字符串开始的位置 |
$ | 字符串结尾的位置 |
\b | 表示单词边界,字符与空格间的位置 |
\B | 表示非单词边界 |
5、子表达式:内嵌的正则表达式,包含在一对()中
6、省略符:为了简化正则表达式而存在的元字符,以\开头
7、修饰符:是指定匹配策略的,不是正则表达式的一部分
参考学习:
https://www.bilibili.com/video/BV1mt4y1o7Rh/?spm_id_from=333....
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。