<!DOCTYPE html>
<html>
<head>
<title>内容</title>
</head>
<body>
中文
<div>内容<i>内容</i></div>
</body>
</html>
将标签里面的内容替换为
<!DOCTYPE html>
<html>
<head>
<title>{{#内容#}}</title>
</head>
<body>
{{#中文#}}
<div>{{#内容#}}<i>{{#内容#}}</i></div>
</body>
</html>
求解正则该怎么写?
第一,学过编译原理的话,你就会知道,正则是没有能力处理嵌套的数据结构的。也就是说,你想通过正则实现【选中 body 中嵌套的 div 的第一个 i 标签】这样的需求,在原理上是行不通的。
第二,你要处理的是一个结构化的 DOM 文本,因此可以使用 jQuery 的 parseHTML 方法来实现。通过 jQuery parse 后得到的对象是可以使用 $ 来进一步选择 div 或 i 等节点的。这就能够简单有效地解决你的文本替换问题了。
如果你在 Node 服务端,那么 jQuery 换成 cheerio 即可。