3

正则

image.png

引言

正则是一个前端必须掌握的知识。但是由于用的少,忘了记,记了忘,导致面试经常坐蜡。这里上篇先介绍正则的规则,下篇结合一些具体题目,带大家重新学习巩固一下正则,争取面试给自己加分。

正则是用来处理字符串的一个规则,我们可以利用正则来验证也可以捕获

验证:判断一个字符串是否符合我们的规则-> reg.test(str)
捕获:把字符串中符合我们规矩的子字符捕获到 ->reg.exec(str)

创建正则

实例创建和使用字面量,但是要注意使用实例创建正式是可以使用变量进行拼接的

正则表达式由两种基本字符类型组成,原义文本字符和元字符

元字符:在正则表达式中具有特殊意义的字符,原义字符变元字符加'\'

元字符分类

边界类

^ 开头 $ 结尾 \b 单词边界 \B非单词边界
/\bengineer$/.test('I am an engineer') //true

量词类

*: 零次到多次
+:1次到多次
?: 0次或者1次
{n} 出现n次
{n,m} 出现n次到m次
   let reg = /1\d{10}$/ //验证手机号,第一位是1

字符集类

[a-z] a-z之间的任何一个字符
[a-zA-Z] a-z以及A-Z之间的任何一个字符
1表示非a的所有字符,2 除了xyz以外的任何一个字符
'a1b2C3C4'.replace(/[a-z]/g,'Q') //"Q1Q2C3C4"

预定义类

// .  除了回车和换行的所有字符 [^\r\n]
// \d 数字 [0-9]
//  \s  空白字符 [\t\n\x0B\f\r]
// \w 单词 字符[A-Za-z0-9_]  //注意,.的范围要比\W范围大,因为它还包括制表符之类的`注意只是一个字符而不是一个单词`
'hello'.replace(/\w{2}$/g,'x')  //helx

修饰符以及正则对象属性

修饰符:

i 忽略大小写
g 全局匹配
m 多行匹配
注意这里设置了,在正则对象里的相应属性会改变
var a = /\d/g
a.global  //true
var b = /\d/
b.global  //false

正则对象属性:

global ignore case multiline lastIndex sourse
注意,lastindex在全局匹配里面会匹配一次改变一个,超出匹配范围会被清零
var reg1 = /\w/
var reg2 = /\w/g
reg1.test('a') //true //reg1.lastIndex //0
reg1.test('a') //true //reg1.lastIndex //0
reg1.test('a') //true //reg1.lastIndex //0
reg2.test('a') //true //reg2.lastIndex //1
reg2.test('a') //false //reg2.lastIndex //0
reg2.test('a') //true //reg2.lastIndex //1
reg2.test('a') //false //reg2.lastIndex //0

贪婪模式和非贪婪模式

正则默认是贪婪模式,会按尽可能多的匹配,在量词后面加?可以取消贪婪性

123456.replace(/\d{3,6}/g,'x') //由于有贪婪性,按6次匹配,结果为'x'
'123456'.replace(/\d{3,6}?/g,'x') //此时没有贪婪性,但是有全局匹配,结果为'xx'
'123456'.replace(/\d{3,6}?/g,'x') //此时没有贪婪性,局部匹配,结果为'x456'

分组以及或

或|,左边的单词(分组)或者右边的单词(分组)出现都可以
分组的目的是为了更好的捕获,增加控制力 分组可以用\num代表
在方法中则用$num表示,'bar foo'.replace(/(...) (...)/, '$2 $1')
注意或|的优先级是最低的,比字符串串接的优先级还要小,所以有/Bayron|casper/是匹配两个单词而不是n或者c的情况
所以|多打括号,看一个有括号和括号的区别 匹配010-xxxx 或者 (010)-xxxx 或者xxx这种电话号码
错误:
image
正确:
image


bary{3}  //y重复3次
(bary){3} //单词重复3次
Bayron|casper //两个单词的或   
Bayr(on|ca)sper //中间两个字母随便出现哪个都行,注意同时出现两个是不匹配的
'Bayroncasper'.replace(/Bayr(on|ca)sper/g,'x') //"Bayroncasper"
'Bayrcasper'.replace(/Bayr(on|ca)sper/g,'x')  //"x"

前瞻和后顾

断言表示一个匹配在某些条件下发生,断言不参与匹配
正则匹配的方向是从左向右,所以向右是前瞻(lookahead)或者先行断言
前瞻就是在正则表达式匹配到规则的时候,向前检查是否符合断言,符合断言则匹配生效
正向前瞻是如果匹配的字符后面是什么则生效
就有负向前瞻(Negative lookahead) 负向前瞻指的是如果匹配的字符后面不是什么则生效

'Windows2000'.replace(/Windows(?=2000)/g,'x')  //"x2000" 正向前瞻 ?=
'Windows2001'.replace(/Windows(?!2000)/g,'x')  //"x2001" 负向前瞻 ?!

(正向负向)后顾(lookbehind)则正好与上面说的相反,大家一看例子就懂

'I has Windows2000'.replace(/(?<=I has )Windows/g,'x')  //"I has x2000" 正向后顾 ?<=
'I has Windows2000'.replace(/(?<!He has )Windows/g,'x')  //"I has x2000" 负向后顾 ?<!

还没听懂的同学仔细研究下这个MDN-正则

方法

正则的方法

正则的方法只有两个,test和exec

exec
一个在字符串中执行查找匹配的RegExp方法,它返回一个数组(未匹配到则返回null)。 与字符串的match对应 数组【匹配值,分组,index,input,】
这里注意,exec一次只匹配一个,匹配不到就会null。只有给修饰符g才能往下继续匹配(使用while)
var myRe = new RegExp("d(b+)d", "g");
var myArray = myRe.exec("cdbbdbsbz");
console.log(myArray)
//["dbbd", "bb", index: 1, input: "cdbbdbsbz", groups: undefined]
---------------------------------------------------------------------
var regex1 = RegExp('foo*','g');
var str1 = 'table football, foosball';
var array1;

while ((array1 = regex1.exec(str1)) !== null) {
  console.log(`Found ${array1[0]}. Next starts at ${regex1.lastIndex}.`);
  // expected output: "Found foo. Next starts at 9."
  // expected output: "Found foo. Next starts at 19."
}
test

一个在字符串中测试是否匹配的RegExp方法,它返回true或false。 与字符串的search对应

字符串的方法
search,match

类似test,exec 但是全局调用match相对exec功能弱了一些,返回的数组元素没有index或者input了
match 如果使用g标志,则将返回与完整正则表达式匹配的所有结果,但不会返回捕获组。
如果未使用g标志,则仅返回第一个完整匹配及其相关的捕获组(Array)。 在这种情况下,返回的项目将具有如下所述的其他属性。
使用全局匹配的match

/
var str = 'For more information, see Chapter 3.4.5.1';
var re = /see (chapter \d+(\.\d)*)/i;
var found = str.match(re);

console.log(found);

// logs [ 'see Chapter 3.4.5.1',
//        'Chapter 3.4.5.1',
//        '.1',
//        index: 22,
//        input: 'For more information, see Chapter 3.4.5.1' ]

// 'see Chapter 3.4.5.1' 是整个匹配。
// 'Chapter 3.4.5.1' 被'(chapter \d+(\.\d)*)'捕获。
// '.1' 是被'(\.\d)'捕获的最后一个值。
// 'index' 属性(22) 是整个匹配从零开始的索引。
// 'input' 属性是被解析的原始字符串。
Copy to Clipboard

不使用全局匹配的Match

var str = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz';
var regexp = /[A-E]/gi;
var matches_array = str.match(regexp);

console.log(matches_array);
// ['A', 'B', 'C', 'D', 'E', 'a', 'b', 'c', 'd', 'e']
Copy to Clipboard
split

非常有用的一个方法,用来按规则分解字符串形成数组

'a1b2c3d4'.split(/\d/g)
// ['a','b','c','d']
replace

非常非常有用的一个方法,全局匹配下由于能自动不断匹配,非常方便。
注意如果参数是字符串会隐式转换为

'a1b1'.replace('1','x') // axb1   为什么会只替换一次呢,因为这里会给你隐式的转换为正则表达式
'a1b1'.replace(/1/g,'x') // axbx
'a1b1'.replace(/\d/g,function(match){ //匹配字符串,分组(没有则没有该参数),index,原字符
    return ~~match + 1
}) // a2b2

  1. a
  2. xyz

Runningfyy
1.3k 声望661 粉丝