js正则表达式学习笔记

说来惭愧，做前端快三年对于正则表达式的应用还是很浅薄，大家都知道正则的速度基本上是最快的，但就是懒得去记那些语法和规则，这次项目中多次用到了需要匹配替换的动作，终于下定决心去研究一下了。

实例化正则对象

对象字面量

/pattern/attributes

正则对象由这两部分构成pattern(匹配规则)+attributes(修饰符)

var reg = /\bis\b/

这样就成功的实例化一个正则表达式对象，接着我们去应用它

字符串的replace函数接受两个参数，第一个参数可以是字符串或者正则表达式，第二个参数是需要替换的字符串，这样我们就成功把小写的’is‘替换成了大写的’IS‘
好多同学看那一串符号又开始头晕了，别急，听我慢慢道来

我们先来拆解这个正则表达式
首先开头结尾的//是必须的，然后是两个’b‘，代表着单词的开头或结尾,也就是单词的分界处，最后中间的is是需要匹配的字符串。连起来意思就是匹配字符串中的is，并且前后必须要有分界，也就是说’isisisisis‘这里的is不能替换成’ISISISISIS‘
好了，有同学会问，为什么句子中的第二个’is‘没有被替换，为什么我们没看到所谓的那个修饰符。我们再改写一下这个正则对象

发现多了一个修饰符g，代表全局（globle）搜索，这样就可以匹配字符串中的所有的’is‘

构造函数

var reg = new RegExp(pattern,attributes)

var reg = new RegExp('\\bis\\b','g') === var reg = /\bis\b/g

这里需要解释下为什么同样的匹配规则却多了两个\
那是因为在js语法中，\需要转义，所以在这里的构造函数参数中需要把\转义

修饰符

g--globe

这个在之前的例子中大家已经见识过了，就是全局搜索，默认匹配到第一个就会停止

i--ignore case

忽略大小写，默认大小写敏感

m--multiple lines

多行搜索

各种规则

元字符

正则表达式有两种基本字符类型组成--原义文本字符和元字符
原义文本字符：字母数字这种无需转义的字符
元字符：在正则表达式中有特殊含义的非字母字符

 * + ? $ ^ . | \ () {} []

字符类

我们可以用元字符[]来构造简单的类
比如说：[abc]就把abc三个字母归为了一类，表达式可以匹配这一类字符

字符类取反

使用元字符^表示不属于创建的类中的字符

范围类

如果要是利用字符类匹配26个英文字母难道要一一写出来么，哈哈哈，too young too simple
使用范围类[a-z]匹配所有的26个英文字母，相加匹配条件就直接加在[]里面。
比如说[a-zA-Z0-9]匹配大小写的英文字母和0-9的数字

预定义类

看一个例子：匹配ab+数字+任意字符的字符串

在学习预定义类之前我们的写法是

ab[0-9][^/n/r]

现在我们学习了预定义类之后就可以这样

ab\d.

边界

这里的单词边界在最早的例子中我们已经见识过了，现在我们对比一下b和B的区别

^和$的用法

需要注意的是^和$在正则中的位置

量词

如果我们需要匹配连续出现100次数字的字符串难道要写100个\b吧
伟大的js语言当然不会这么傻了，这不引入了量词的概念么

这一次的例子我们结合接下来的概念一起理解

贪婪模式与非贪婪模式

这个例子中我们把0-9这九个数字先是用{3，6}来全局匹配，发现匹配出两个NB
我来解释一下，正则表达式默认是贪婪模式匹配，即在量词范围中取最大的那个来匹配，所以第一个才会出现两个NB，1-6匹配一个NB,7-9匹配一个NB。而第二个匹配范围是{3，7}，结果是NB89，因为最大值是7，所以1-7匹配成NB，而剩下的8，9达不到3个，所以没有匹配成功

这个非贪婪模式和贪婪模式相反，即取最小值来匹配，用法是在量词后面加？。
正确设置匹配模式对于处理复杂的正则是很有益处的

分组

现在有这样的需求，匹配wensnb这个字符串出现三次，是不是有的同学会说

wensnb{3}

这样当然是错啦，因为只会匹配b出现三次，这时候就需要分组的概念

()可以起到分组的效果

用 | 表示或，下面的例子展示或在分组中的应用

（）把nb和123分组，并且用|表示两者取其一

反向引用

利用$进行分组中的引用，分别把分组中的内容对应$1....$n

忽略引用

并不是所有的分组我们都希望引用，用?:来忽略引用

我们把上个例子中的第二个引用忽略，所以引用个数由3变成2个，因此找不到$3
原来对应$3的24现在变成了$2，而$1不变

前瞻

大家听这个名字前瞻就知道一定有一个后顾和他对应，说的没错，只不过在js语法中的正则不支持后顾，所以我们只关注前瞻就够了

我们先来定义“前”：

在正则表达式中匹配是由文本头部到尾部（左到右），所以这个“前”代表的是文本的尾部

下面来定义前瞻：

正则表达式匹配到规则时再向前检查是否符合断言或者不符合断言（也是正则）

正向和负向前瞻的区别就是匹配到正则之后是否符合断言，符合断言称为正向前瞻，不符合就是负向前瞻

下面来看一个例子

在这个正向前瞻中，匹配一个单词字符（w不仅代表单词，还代表数字下划线）并且前面的还要符合数字1-3这个断言才行，因此我们把w e n这三个字符匹配到了

正则表达式的属性和方法

属性

在文章的开始我们介绍了修饰符globle,ignoreCase,multilines
其实这个都是正则表达式的属性，并且有两个我们没有说lastIndex和source
这五个属性都是只读，不能修改

方法

RegExp.prototype.test(str) //匹配传入的字符串符不符合正则规则（true or false）

RegExp.prototype.exec(str)

js正则表达式学习笔记

实例化正则对象

修饰符

各种规则

贪婪模式与非贪婪模式

分组

前瞻

正则表达式的属性和方法

wens

引用和评论

你以为升级HTTPS就万事大吉了吗？？？

2025年最新反编译微信小程序的教程及工具

手写一个动态海洋和天空效果的vue hooks

你可能不知道的图片加载相关知识

原生JS大揭秘—JS代码执行原理解刨

原生electron起步-从零到一完成构建和打包

LRU算法，你别跑，我就要吃透你