网上找了个匹配网址的正则表达式(^http:\/\/[_a-zA-Z0-9-]+(.[_a-zA-Z0-9-]+)*$
),但是有很多网址不能匹配到
比如:
网址:http://www.sz.gov.cn/cn/hdjl/zxts/dfyj/
执行结果:boolean false
(意思就是这不是个网址)
求一个能匹配任意网址的正则表达式(执行效率越快越好)。
谢谢
找了一个可用的:((http|ftp|https):\/\/)?[\w\-_]+(\.[\w\-_]+)+([\w\-\.,@?^=%&:/~\+#]*[\w\-\@?^=%&/~\+#])?
执行效率不知道有没有更快的
这有一个 Markdown 的作者之一写的正则表达式(原文在这)。他把这个表达式都改进了好几年了,应该比较全面而且保险:
测试代码:
除非涉及的数据量特别特别大,否则单单一个正则表达式还达不到影响性能的程度吧。基本不必担心效率问题的。