之前大三学习《编译原理》的时候老师讲了点叫断言的东西,但是这门课压根就没听懂过,所以一直找不到有价值的东西,好吧原谅我懒惰无知,理论不适合我,我只适合搬砖。许久之后一些关于正则的黑科技才发现正则里也有较断言的东东,好吧得了解了解这是什么。
那么正则里的断言是什么?
引用一段来自百科的说明
用于查找在某些内容(但并不包括这些内容)之前或之后的东西,也就是说它们像b,^,$那样用于指定一个位置,这个位置应该满足一定的条件(即断言),因此它们也被称为零宽断言。(来自百度百科)
断言在一些教材里也称作环视
。
断言写法
-
前瞻断言
(?=exp)
顺序肯定环视,表示所在位置右侧能够匹配exp(?!exp)
顺序否定环视,表示所在位置右侧不能匹配exp
-
后瞻断言
(?<=exp)
逆序肯定环视,表示所在位置左侧能够匹配exp(?<!exp)
逆序否定环视,表示所在位置左侧不能匹配exp
解析:
前瞻断言(从当前位置向前测试)和后瞻断言(从当前位置向后测试)。
具体的例子看使用方法吧。
注:
括号是必须的,写法:(?!=...)
有些语言并不完全支持,比如:javascript的正则并不支持
后瞻断言
表达式,使用了会报错的。其中
exp
是一个正则表达式可以是子模式,如:(?=((exp))
。环视也称断言;断言是不占用字符串的((?=exp)所以不能引用,exp是占用字符串的)
使用方法
(?=exp)
顺序肯定环视,表示所在位置右侧能够匹配exp
来个javascript的例子,匹配.gif
的文件名
var s="img.jpg,abc.gif,123.jpeg";
s.match(/\w*(?=\.gif)/);
结果:
["abc"]
/\w*(?=\.gif)/
中的\w*
表示可以有零个或多个字符,匹配到的是abc
,那么(?=.gif)这个匹配到什么?其实他匹配到的只是一个位置,这就是断言的初衷,匹配到的是介于abc
与.gif
的位置。
好吧不信来验证下:
去掉正则表达式的\w*
,在匹配到的内容替换成#
var s="img.jpg,abc.gif,123.jpeg";
s.replace(/(?=\.gif)/,"#");
结果:
"img.jpg,abc#.gif,123.jpeg"
回到定义:(?=exp)
顺序肯定环视,表示所在位置右侧能够匹配exp;那么/\w*(?=\.gif)/
的意思就是以.gif
作为右边的位置才匹配成功,那就会匹配到abc.gif
这里就成功了,之前说过断言匹配不占用字符宽度(即不结果不会包含断言部分),所以匹配到的字符串就是\w*
即'abc'。
(?!exp)
顺序否定环视,表示所在位置右侧不能匹配exp
例子:匹配非.gif
的文件名
var s="img.jpg,abc.gif,123.jpeg";
s.match(/(\w*)(?:\.)(?!gif)\w*/g);
结果:
["img.jpg", "123.jpeg"]
/(\w*)(?:\.)(?!gif)\w*/g
这个正则表示(\w*)(?:\.)
的右边不是gif匹配成功。
对于后瞻断言
的例子这里不举例子,如果哪位有空填下吧。
使用例子
来看一个来自网络的问答例子:把一串数
10000000000
字以,
分隔成10,000,000,000
这个例子0
有点多看着耀眼,先从简单的开始;好吧我们换一串字符串比如:12345678
转换成12,345,678
。
正则怎么实现呢?
看代码:
var s="12345678";
s.replace(/(?=(\d{3})+(?!\d))/g,",");
是的就这样就可以了。
好吧,来分析下原理:
/(?=(\d{3})+(?!\d))/g
,其中(\d{3})+
表示前面的三个数字串至少出现一组,而后接(?!\d)
则表示的是数字的右边不是数字,
那么就是结尾,那/(?=(\d{3})+(?!\d))/
匹配到的位置就是12
与345678
之间的位置,加了g
表全局匹配,
所以继续匹配到满足条件的345
与678
之间的位置,在这些加,
就有了12,345,678
了。
如果想看这个例子的过程可以改写下代码:
var s="12345678";
s.replace(/(?=((\d{3})+)(?!\d))/g,function(){console.log(arguments);return ","});
结果:
循环1:["", "345678", "678", 2, "12345678"]
循环2:["", "678", "678", 5, "12345678"]
返回值:"12,345,678"
好吧,原理不再细说,自己复制代码到浏览器控制台执行看效果。
那么这个10000000000
转成10,000,000,000
就很简单了。
但是如果数字串的位数是3的倍数会出现在数字串前面也有一个,
号,好吧再正则去掉result.replace(",","")
。
后语
上面举的一些例子可能不足以说明问题,如果你是精通正则的高手望勿喷,当然多多指教那就更好了。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。