js正则替换问题

<!DOCTYPE html>
<html>
<head>
    <title>内容</title>
</head>
<body>
中文
<div>内容<i>内容</i></div>
</body>
</html>

将标签里面的内容替换为

<!DOCTYPE html>
<html>
<head>
    <title>{{#内容#}}</title>
</head>
<body>
{{#中文#}}
<div>{{#内容#}}<i>{{#内容#}}</i></div>
</body>
</html>

求解正则该怎么写?

阅读 2.1k
1 个回答

第一,学过编译原理的话,你就会知道,正则是没有能力处理嵌套的数据结构的。也就是说,你想通过正则实现【选中 body 中嵌套的 div 的第一个 i 标签】这样的需求,在原理上是行不通的。

第二,你要处理的是一个结构化的 DOM 文本,因此可以使用 jQuery 的 parseHTML 方法来实现。通过 jQuery parse 后得到的对象是可以使用 $ 来进一步选择 div 或 i 等节点的。这就能够简单有效地解决你的文本替换问题了。

如果你在 Node 服务端,那么 jQuery 换成 cheerio 即可。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题