1

匹配规则

字面量字符

大部分字符在正则表达式中,就是字面的含义。如果在正则表达式之中,某个字符只表示它字面的含义,那么它们就是“字面量字符”(literalcharacters)
/Wade/.test('Dwyane Wade')    // true

上面代码中正则表达式的Wade,就是字面量字符,所以 /Wade/ 匹配 Dwyane Wade.

元字符

除了字面量字符以外,还有一部分字符有特殊含义,不代表字面的意思。它们叫做“元字符”(metacharacters)
  • 点字符 (.)
匹配任意一个字符,除了换行和行结束符。
var regexp = /w.e/; 
regexp.test('wae')    // true
regexp.test('wade');  // false
  • 位置字符
位置字符用来提示字符所处的位置,主要有两个字符。
  1. ^ 表示字符串的开始位置
  2. $ 表示字符串的结束位置
// test必须出现在开始位置
/^test/.test('test-wade');    // true
// test必须出现在结束位置
/test$/.test('wade-test');    // true

// 开始位置到结束位置只有test
/^test$/.test('test');        // true
/^test$/.test('test test');   // false
  • 选择符 (|)
竖线符号(|)在正则表达式中表示“或关系”(OR)
// 匹配Test或Wade
/Test|Wade/.test('DwyaneWade')        // true

多个选择符可以联合使用

// 匹配Test、Dwyane、Wade之中的一个
/Test|Dwyane|Wade/.test('Dwyane3')    // true

选择符会包括它前后的多个字符,比如/ab|cd/指的是匹配ab或cd,而不是指匹配b或者c。如果想修改这个行为,可以使用圆括号。

/a( |\t)b/.test('a\tb');    // true

转义符

正则表达式中那些有特殊含义的元字符,如果要匹配它们本身,就需要在它们前面要加上反斜杠。
/1+1/.test('1+1');     // false
/1\+1/.test('1+1');    // true

正则表达式中,需要反斜杠转义的,一共有12个字符:^、.、[、$、(、)、|、*、+、?、{和。

特殊字符

正则表达式对一些不能打印的特殊字符,提供了表达方法。
  • n 匹配换行键
  • r 匹配回车键
  • t 匹配制表符 tab(U+0009)
  • v 匹配垂直制表符(U+000B)
  • f 匹配换页符(U+000C)
  • [b] 匹配退格键(U+0008),不要与b混淆
  • 0 匹配null字符(U+0000)
  • cX 表示Ctrl-[X],其中的X是A-Z之中任一个英文字母,用来匹配控制字符

字符类

字符类(class)表示有一系列字符可供选择,只要匹配其中一个就可以了。所有可供选择的字符都放在方括号内,比如[abc] 表示a、b、c之中任选一个匹配。
/[abc]/.test('Dwyane');    // true

有两个字符在字符类中有特殊含义

1.脱子符(^)

如果方括号内的第一个字符是[^],则表示除了字符类之中的字符,其他字符都可以匹配。比如1 表示a、b、c之外都可以匹配。
/[^abc]/.test('Test');    // true
如果方括号内没有其他字符,即只有[^],就表示匹配一切字符,其中包括换行符。上文提到的点字符(.)是不包括换行符的。
/wa.e/.test('wa\ne');     // false
/wa[^]/.test('wa\ne');    // true

2.连字符(-)

连字符(-)表示字符的连续范围。比如[0123456789]可以写成[0-9],[A-Z]表示26个大写字母。
/a-z/.test('b');     // false
/[a-z].test('b');    // true

预定义模式

预定义模式指的是某些常见模式的简写方式。
 - \d 匹配0-9之间的任一数字,相当于[0-9]
 - \D 匹配所有0-9以外的字符,相当于[^0-9]
 - \w 匹配任意的字母、数字和下划线,相当于[A-Za-z0-9_]
 - \W 除所有字母、数字和下划线以外的字符,相当于[^A-Za-z0-9_]
 - \s 匹配空格(包括换行符、制表符、空格符等),相等于[ \t\r\n\v\f]
 - \S 匹配非空格的字符,相当于[^ \t\r\n\v\f]
 - \b 匹配词的边界
 - \B 匹配非词边界,即在词的内部
/\w/.test('wade03');    // true

重复类

模式的精确匹配次数,使用大括号({})。{n}表示恰好重复n次,{n,}表示至少重复n次,{n,m}表示重复不少于n次,不多于m次。

/te{2}st/.test('teest');          // true
/te{2,5}st/.test('teeeeeest');    // false

量词符

量词符用来设定某个模式出现的次数。
  • ? 问号表示某个模式出现0次或1次,等同于{0, 1}
    • 星号表示某个模式出现0次或多次,等同于{0,}
    • 加号表示某个模式出现1次或多次,等同于{1,}
// t 出现0次或1次
/t?est/.test('test');    // true
/t?est/.test('est');     // true

// t 出现0次或多次
/t*est/.test('tttest');  // true
/t*est/.test('est');     // true

// t 出现1次或多次
/t+est/.test('ttest');   // true
/t+est/.test('est');     // false

贪婪模式

上文中量词符,默认情况下都是最大可能匹配,即匹配直到下一个字符不满足匹配规则为止。这被称为贪婪模式。
var str= 'aaa';
str.match(/a+/);    // ["aaa"]

如果想将贪婪模式改为非贪婪模式,可以在量词符后面加一个问号(?)。

  • +?:表示某个模式出现1次或多次,匹配时采用非贪婪模式。
  • *?:表示某个模式出现0次或多次,匹配时采用非贪婪模式。
  • ??:表格某个模式出现0次或1次,匹配时采用非贪婪模式。
var str = 'aaa';
str.match(/a+/);    // ["a"]

修饰符

修饰符(modifier)表示模式的附加规则,放在正则模式的最尾部。
  • g :全局匹配(global),正则对象将匹配全部符合条件的结果,主要用于搜索和替换
  • i :忽略大小写(ignorecase)
  • m :^和$可以匹配行首和行尾了,即^和$会识别换行符(n)
// 正则模式不含g修饰符,每次都是从字符串头部开始匹配。
var regex = /b/;
var str = 'abba';

regex.test(str); // true
regex.test(str); // true

// 正则模式含有g修饰符,每次都是从上一次匹配成功处,开始向后匹配。由于只有一个b,第二次就失败了
var regex = /b/g;
var str = 'aba';

regex.test(str); // true
regex.test(str); // false

// 加了i修饰符以后,不考虑大小写,所以模式abc匹配字符串ABC
/abc/.test('ABC') // false
/abc/i.test('ABC') // true

// 字符串结尾处有一个换行符。如果不加m修饰符,为false。加上以后,$可以匹配行尾
/world$/.test('hello world\n') // false
/world$/m.test('hello world\n') // true

组匹配

正则表达式的括号表示分组匹配,括号中的模式可以用来匹配分组的内容。
// 第一个模式没有括号,结果+只表示重复字母t。第二个模式有括号,结果+就表示匹配test
/test+/.test('testt')      // true
/(test)+/.test('testtest') // true
(?:x):非捕获组(Non-capturing group),表示不返回该组匹配的内容,即匹配的结果中不计入这个括号。
// 正常匹配
var url = /(http|ftp):\/\/([^/\r\n]+)(\/[^\r\n]*)?/;

url.exec('http://google.com/');
// ["http://google.com/", "http", "google.com", "/"]

// 非捕获组匹配
var url = /(?:http|ftp):\/\/([^/\r\n]+)(\/[^\r\n]*)?/;

url.exec('http://google.com/');
// ["http://google.com/", "google.com", "/"]
x(?=y):先行断言(Positive look-ahead),x只有在y前面才匹配,y不会被计入返回结果。
/\d+(?=%)/.test('23%');    // true
/\d+(?=%)/.test('2A%');    // false
x(?!y):先行否定断言(Negative look-ahead),x只有不在y前面才匹配,y不会被计入返回结果。
/\d+(?!%)/.test('2%');     // false

  1. abc

DwyaneWade
6 声望0 粉丝

« 上一篇
数据类型二