匹配规则
字面量字符
大部分字符在正则表达式中,就是字面的含义。如果在正则表达式之中,某个字符只表示它字面的含义,那么它们就是“字面量字符”(literalcharacters)
/Wade/.test('Dwyane Wade') // true
上面代码中正则表达式的Wade,就是字面量字符,所以 /Wade/ 匹配 Dwyane Wade.
元字符
除了字面量字符以外,还有一部分字符有特殊含义,不代表字面的意思。它们叫做“元字符”(metacharacters)
- 点字符 (.)
匹配任意一个字符,除了换行和行结束符。
var regexp = /w.e/;
regexp.test('wae') // true
regexp.test('wade'); // false
- 位置字符
位置字符用来提示字符所处的位置,主要有两个字符。
- ^ 表示字符串的开始位置
- $ 表示字符串的结束位置
// test必须出现在开始位置
/^test/.test('test-wade'); // true
// test必须出现在结束位置
/test$/.test('wade-test'); // true
// 开始位置到结束位置只有test
/^test$/.test('test'); // true
/^test$/.test('test test'); // false
- 选择符 (|)
竖线符号(|)在正则表达式中表示“或关系”(OR)
// 匹配Test或Wade
/Test|Wade/.test('DwyaneWade') // true
多个选择符可以联合使用
// 匹配Test、Dwyane、Wade之中的一个
/Test|Dwyane|Wade/.test('Dwyane3') // true
选择符会包括它前后的多个字符,比如/ab|cd/指的是匹配ab或cd,而不是指匹配b或者c。如果想修改这个行为,可以使用圆括号。
/a( |\t)b/.test('a\tb'); // true
转义符
正则表达式中那些有特殊含义的元字符,如果要匹配它们本身,就需要在它们前面要加上反斜杠。
/1+1/.test('1+1'); // false
/1\+1/.test('1+1'); // true
正则表达式中,需要反斜杠转义的,一共有12个字符:^、.、[、$、(、)、|、*、+、?、{和。
特殊字符
正则表达式对一些不能打印的特殊字符,提供了表达方法。
- n 匹配换行键
- r 匹配回车键
- t 匹配制表符 tab(U+0009)
- v 匹配垂直制表符(U+000B)
- f 匹配换页符(U+000C)
- [b] 匹配退格键(U+0008),不要与b混淆
- 0 匹配null字符(U+0000)
- cX 表示Ctrl-[X],其中的X是A-Z之中任一个英文字母,用来匹配控制字符
字符类
字符类(class)表示有一系列字符可供选择,只要匹配其中一个就可以了。所有可供选择的字符都放在方括号内,比如[abc] 表示a、b、c之中任选一个匹配。
/[abc]/.test('Dwyane'); // true
有两个字符在字符类中有特殊含义
1.脱子符(^)
如果方括号内的第一个字符是[^],则表示除了字符类之中的字符,其他字符都可以匹配。比如1 表示a、b、c之外都可以匹配。
/[^abc]/.test('Test'); // true
如果方括号内没有其他字符,即只有[^],就表示匹配一切字符,其中包括换行符。上文提到的点字符(.)是不包括换行符的。
/wa.e/.test('wa\ne'); // false
/wa[^]/.test('wa\ne'); // true
2.连字符(-)
连字符(-)表示字符的连续范围。比如[0123456789]可以写成[0-9],[A-Z]表示26个大写字母。
/a-z/.test('b'); // false
/[a-z].test('b'); // true
预定义模式
预定义模式指的是某些常见模式的简写方式。
- \d 匹配0-9之间的任一数字,相当于[0-9]
- \D 匹配所有0-9以外的字符,相当于[^0-9]
- \w 匹配任意的字母、数字和下划线,相当于[A-Za-z0-9_]
- \W 除所有字母、数字和下划线以外的字符,相当于[^A-Za-z0-9_]
- \s 匹配空格(包括换行符、制表符、空格符等),相等于[ \t\r\n\v\f]
- \S 匹配非空格的字符,相当于[^ \t\r\n\v\f]
- \b 匹配词的边界
- \B 匹配非词边界,即在词的内部
/\w/.test('wade03'); // true
重复类
模式的精确匹配次数,使用大括号({})。{n}表示恰好重复n次,{n,}表示至少重复n次,{n,m}表示重复不少于n次,不多于m次。
/te{2}st/.test('teest'); // true
/te{2,5}st/.test('teeeeeest'); // false
量词符
量词符用来设定某个模式出现的次数。
- ? 问号表示某个模式出现0次或1次,等同于{0, 1}
- 星号表示某个模式出现0次或多次,等同于{0,}
- 加号表示某个模式出现1次或多次,等同于{1,}
// t 出现0次或1次
/t?est/.test('test'); // true
/t?est/.test('est'); // true
// t 出现0次或多次
/t*est/.test('tttest'); // true
/t*est/.test('est'); // true
// t 出现1次或多次
/t+est/.test('ttest'); // true
/t+est/.test('est'); // false
贪婪模式
上文中量词符,默认情况下都是最大可能匹配,即匹配直到下一个字符不满足匹配规则为止。这被称为贪婪模式。
var str= 'aaa';
str.match(/a+/); // ["aaa"]
如果想将贪婪模式改为非贪婪模式,可以在量词符后面加一个问号(?)。
- +?:表示某个模式出现1次或多次,匹配时采用非贪婪模式。
- *?:表示某个模式出现0次或多次,匹配时采用非贪婪模式。
- ??:表格某个模式出现0次或1次,匹配时采用非贪婪模式。
var str = 'aaa';
str.match(/a+/); // ["a"]
修饰符
修饰符(modifier)表示模式的附加规则,放在正则模式的最尾部。
- g :全局匹配(global),正则对象将匹配全部符合条件的结果,主要用于搜索和替换
- i :忽略大小写(ignorecase)
- m :^和$可以匹配行首和行尾了,即^和$会识别换行符(n)
// 正则模式不含g修饰符,每次都是从字符串头部开始匹配。
var regex = /b/;
var str = 'abba';
regex.test(str); // true
regex.test(str); // true
// 正则模式含有g修饰符,每次都是从上一次匹配成功处,开始向后匹配。由于只有一个b,第二次就失败了
var regex = /b/g;
var str = 'aba';
regex.test(str); // true
regex.test(str); // false
// 加了i修饰符以后,不考虑大小写,所以模式abc匹配字符串ABC
/abc/.test('ABC') // false
/abc/i.test('ABC') // true
// 字符串结尾处有一个换行符。如果不加m修饰符,为false。加上以后,$可以匹配行尾
/world$/.test('hello world\n') // false
/world$/m.test('hello world\n') // true
组匹配
正则表达式的括号表示分组匹配,括号中的模式可以用来匹配分组的内容。
// 第一个模式没有括号,结果+只表示重复字母t。第二个模式有括号,结果+就表示匹配test
/test+/.test('testt') // true
/(test)+/.test('testtest') // true
(?:x):非捕获组(Non-capturing group),表示不返回该组匹配的内容,即匹配的结果中不计入这个括号。
// 正常匹配
var url = /(http|ftp):\/\/([^/\r\n]+)(\/[^\r\n]*)?/;
url.exec('http://google.com/');
// ["http://google.com/", "http", "google.com", "/"]
// 非捕获组匹配
var url = /(?:http|ftp):\/\/([^/\r\n]+)(\/[^\r\n]*)?/;
url.exec('http://google.com/');
// ["http://google.com/", "google.com", "/"]
x(?=y):先行断言(Positive look-ahead),x只有在y前面才匹配,y不会被计入返回结果。
/\d+(?=%)/.test('23%'); // true
/\d+(?=%)/.test('2A%'); // false
x(?!y):先行否定断言(Negative look-ahead),x只有不在y前面才匹配,y不会被计入返回结果。
/\d+(?!%)/.test('2%'); // false
- abc ↩
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。