关于正则表达式div嵌套提取信息问题?

很多个div嵌套,如何使用正则提取成对div中间所有的信息(包括中间的div),比如下面这个例子,我想提取含有class(包含自己也行)的div内部所有信息,哪位大哥解答一下,最好附上Java代码,谢谢了
<div>

<div class="XXX">
    <div>
        <div>....</div> 
    </div>
</div>

</div>

阅读 1.5k
1 个回答

用 html 解析器,比如 Jsoup

String html = Jsoup.parse("<div>\n"
        + "\n"
        + "<div class=\"XXX\">\n"
        + "    <div>\n"
        + "        <div>....</div> \n"
        + "    </div>\n"
        + "</div>\n"
        + "</div>")
        // .outputSettings(new OutputSettings().prettyPrint(false)) // 取消美化
        .select(".XXX")
        .html();
<div>
 <div>
  ....
 </div>
</div>
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题