关于html字符串正则判断和匹配

Alee

阅读 1 分钟

1

前言

最近在写一个组件，需要传入html字符串，里面用到了很多正则来判断是否是html标签或者匹配标签内的文本等，这里记录下。

如何判断传入的字符串包含一个闭合html标签

/<\/?[a-z][\s\S]*>/i
这个其实并不能判断标签闭合的完整性或者顺序等，只是判断字符串中是否有html标签(包含自定义标签)，这对我来说足够了。这给正则里面需要学习的就是[\s\S]可以代表一切字符串。
/<([a-z][\s\S]*)>.*<\/\1>/i
这个就更加规范一些可以匹配一个完整闭合的标签，\1代表前面的圆括号内捕获的内容，是正则的比较高级的用法。

如何匹配出一个标签内的文本内容

str = str.replace(/<title>[\s\S]*?<\/title>/, '<title>' + newTitle + '<\/title>');

最好用一个语义化标签或者自定义标签来做匹配，如果使用div这种一段字符串中可能有好多个的，问题会很多。
[sS]*代表任意字符
*后面的?代表非贪婪模式，因为正则匹配默认都是贪婪模式的

总结

用正则从html标签中匹配文字其实是一种很低效的方式，不到必要时候也没必要去使用，有篇文章深刻的批判了这种行为有兴趣可以看一下。

前端正则表达式

阅读 6k发布于 2019-12-11

Alee

291 声望8 粉丝

既然路走偏了，那就重新开始吧。

« 上一篇

vue/cli建立vue+typescript模板工程后，使用eslint+prettier进行格式化

下一篇 »

一、d3入门基础篇

引用和评论

推荐阅读

CSS3原生变量使用

Alee阅读 1.4k

手写一个动态海洋和天空效果的vue hooks

夕水赞 7阅读 1.7k

你可能不知道的图片加载相关知识

夕水赞 7阅读 5.1k

使用CSS给标题添加书名号并超出省略

XboxYan赞 3阅读 2.5k

原生electron起步-从零到一完成构建和打包

兔子先森赞 3阅读 3.3k评论 1

Koa+Typescript起手式(空环境) 不用每次玩node都要搭环境了！

alwaysVe赞 4阅读 11.6k

LRU算法，你别跑，我就要吃透你

夕水赞 3阅读 4.5k

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。