2

知识学到自己手里的才是自己的,如果复制,粘贴别人的对自己帮助并不大,它只能帮自己解决一时的问题(有时还要花费自己大量的时间来查找),而不能从根本上解决问题。

就好像前段时间我的的大学同学问了我一个正则问题,如何验证用户输入的密码必须包含字符、数字、特殊符号,他说在百度上找了大量的正则示例都不能解决问题,我就问然后呢,他给我说我问你,我当时就无语了,我当时因为正在做项目,一时没想出来,我跟他说你没试着换个思路,暂时没有找到用一个正则解决这个问题的你就不会试着分别对字符,数字,特殊字符单独判断,然后进行与运算不就行了,再者说了从用户体验上用一个正则判断后给出一个结果,用户体验也不好,应该针对用户输入不同的情况给出不同的提示信息,如果密码的组成没有数字,就提示没有数字,如果没有字符就提示没有字符...... , 如果以此类推觉得判断过多,你可以再简化处理,如只有密码组成包含两种,就提示缺少的一种,如果密码组成只包含一种,就提示密码应该有字符、数字、特殊符号组成。

这无形中给我上了生动的一课,正则不仅其他人忽视了,我也忽视了,有所欠缺。所以尽管最近在努力拿下设计模式这个高地,还是决定抽出一部分时间梳理一下自己的正则知识的掌握。

具有特殊含义的字符

下面只列出常用的字符,以及我个人对它们的分类。

分组和集合

  • () : 括号内的表达式表示一个分组
  • [] : 方括号内的表达式表示一个集合

运算符

  • ^ : 如果出现在集合([])中表示取反,否则是是定位符,从字符串的前边界开始匹配
  • | :它表示或的意思,就是起到或运算的作用
  • ?: : 它的作用是放在第一个选项前来消除相关匹配会被缓存这种副作用

定位符

  • ^ : 上面已经说了它定义正则运算的前边界
  • $ : 它定义了正则运算的后边界
  • \b : 匹配一个字符的边界(也即是字符和空白字符的分界)

字符类(代表一类字符)

  • \d : 代表数字,而 \D ,非数字
  • \w : 代表单词,而 \W ,非单词
  • \s : 代表空白符,而 \D ,非空白字符
  • . : 任意字符

限定符

它是用来指定匹配结果的长度或次数。

匹配该符号前面的表达式

  • + : 一次或更多次
  • * :零次或多次
  • : 零次或一次
  • {} : 匹配次数与话括号内的值有关。

    如果 {n} ,就是匹配n次;
    如果 {n,} ,就是匹配至少n次;
    如果 {n,m} ,就是匹配n到m之间的任意次数。

如何玩转正则

正则用在字符串的处理上,可以减少我们的js代码的书写量,优化我们的代码,同时对于我们学习别人源码中复杂的正则已有帮助。

下面是一张来自知乎关于你是如何学会正则表达式的?问题的一张图,掌握这张图的正则,大概你就能解决你所面临的大部分问题。

regular

/^\s*[A-Za-z_$][\w$]*(?:\.[A-Za-z_$][\w$]*|\['*?'\]|\[".*?"\]|\[\d+\]|\[[A-Za-z_$][\w$]*\])*\s*$/

下面推荐几款可视化的正则编辑器。

regexper (这是我最早接触到的一款)

Regulex (这一款是我现在经常使用的)

RegExr (这一款功能很强大,对于学习正则很有帮助,如果学习正则的话强烈推荐)

js如何使用

正则是一个很强大的字符串查询和替换的方法。

以前我们有时侯总是在想将字符串转换为数字数组,利用数组的方法来处理字符,但是要知道字符串就是我们在生活和工作中常见的形式,数字、数组、Boolean类型的相对较少,尤其是最近在做微信开发时发现正则很重要,我同学的例子,只是给了我一个深入学习和研究的动力,这只是我的初步总结,以后有必要的话还会加强。

在JavaScript中我们使用 RegExp 来创建一个对象来实现正则表达式。

基本定义

一个正则有两部分组成:正则主体和修饰符。

形式如下:

regExp = new RegExp('pattern', 'flag');

// 或者
regExp = /pattern/gmi

正则的修饰符一共有5种,分别为:

  • g : 所有匹配的情况,如果没有它,只一种匹配情况
  • i : 忽略字符的大小写
  • m : 支持多行
  • u : 支持 Unicode
  • y : 严格模式(返回指定位置后的匹配结果)

正则对象的一些方法

regexp.test(str)

test 方法返回值为true/false

let str = "Hello world!";
let regexp = /hello/i;
console.log(regexp.test(str));
regexp.exec(str)

由于这个方法不好用,所以很少有人使用。

let str = "Hello world!";
let regexp = /l(o)/ig; // 如果用exec返回所有的的匹配结果需要加上 ‘g’ 修饰符
let matchOne = regexp.exec(str);
console.log(matchOne[0]); // lo
console.log(matchOne[1]); // o
console.log(matchOne.index); // 3
console.log(matchOne.input); // Hello world!
console.log(matchOne.lastIndex); // 5

如果没有匹配返回null

js中String可以使用正则的方法

在String的方法中使用正则,可以轻松的解决我们日常开发中的问题。

str.search()

如果有匹配结果,返回第一个匹配结果的首字符位置;否则,返回 `-1`。

let str = "Hello world!";
regexp = /o/i;
str.search(regexp); // 4

注;search 只能返回第一次匹配的结果,而不能返回其他匹配结果

str.match(str|reg)

let str = "Hello world!";
regexp = /o/i;
let result = str.match(regexp);

console.log(result[0]); // o
console.log(result.index); // 4
console.log(result.input); // Hello world!

我们发现 str.match() 的用法和 regexp.exec() 返回的结果很一样,其实match的底层实现就是 regexp.exec(),使用也一样,注意修饰符 g

str.split(reg|substr, limit)

将给定的字符串按单词为单位进行分割,返回一个由单词组成的数组。

let str = 'Hello world, my   name  is lzb.'
let regexp = /\s+/i;
str.split(regexp); // ["Hello", "world,", "my", "name", "is", "lzb."]
str.split(regexp, 3) //  ["Hello", "world,", "my"]

在这个字符串的方法中第二参数限制返回结果数组的长度。

在返回的结果中,我们发现有的单词带有特殊符号,下面一个字符串方法将实现清除特殊符号。

str.replace(str|reg, str|func)

如果要实现上面示例的清除字符中特殊符号的目标,我们可以使用 str.replace() ,效果如下:

let str = 'Hello world, my   name  is lzb.'
let regexp = /[.,\/#!$%\^&\*;:{}=\-_`~()]/g;
str.replace(regexp, ''); // "Hello world my   name  is lzb"

或者

let str = 'Hello world, my   name  is lzb.'
let regexp = /[^\w\s|-]/g;
str.replace(regexp, ''); // "Hello world my   name  is lzb"

然后,接着使用上面的 str.split() 方法即可,或者有同学可能想到如下方法:

let str = 'Hello world, my   name  is u-lzb.'
let regexp = /[^\w]+/g;
str.split(regexp); // ["Hello", "world", "my", "name", "is", "u", "lzb", ""]

这种方法不建议使用,问题很明显,这里就不多说了。

我们发现上面实现清除字符串中特殊符号的方法有两种,这两种方法谈不上孰优孰劣,它们各有优势。如果在我们把字符串中 work_up, call&apply::arga=b … 都当作特殊的单词,我们就需要第一种方法;如果我们就是要中规中矩的单词我们可以使用第二种方法。

如果第二个参数是func,介绍一个例子,字符串中单词的首字母大写:

let str = 'hello world';
str.replace(/\b\w+\b/g, (word) => word.substring(0,1).toUpperCase() + word.substring(1) );

字符串还有 lengthindexOfconcattoLowerCasetoUpperCase 等方法,这里就不一一介绍了。

推荐

如果喜欢码题的同学可到https://www.hackerrank.com/domains/regex/re-introduction这个网站去。

github.com/lvzhenbang/article


缘自世界
3.5k 声望8.4k 粉丝

心态很重要,我始终相信没有不会做的,只有不想做的,在这个人人都聪明的今天,你不凭智慧,只需努力就能打败90%的对手,如果你再展现出你50%的智慧,我想没有什么问题可以难倒你。