python 正则匹配指定开始HTML标签后和结束标签中的内容

python 正则匹配指定开始HTML标签和结束标签中的内容

 <div class="pbm mbm bbda cl">
         <h2 class="mbn">用户认证</h2>
         <a href="http://bbs.aa.cc/home.php?mod=spacecp&amp;ac=profile&amp;op=verify&amp;vid=1" target="_blank"><img src="http://bbs.aa.cc/data/attachment/common/c4/common_1_verify_icon.png" class="vm" alt="开发者" title="开发者" /></a>&nbsp;
        </div>

       <div class="pbm mbm bbda cl">
         <h2 class="mbn">活跃概况</h2>
         <ul>
          <li> <em class="xg1">用户组&nbsp;&nbsp;</em><span style="color:#FF0000"><a href="http://bbs.aa.cc/home.php?mod=spacecp&amp;ac=usergroup&amp;gid=21" target="_blank"><font color="#FF0000">开发者</font></a></span> </li>
          <li><em class="xg1">扩展用户组&nbsp;&nbsp;</em>注册会员</li>
         </ul>
         <ul id="pbbs" class="pf_l">
          <li><em>在线时间</em>28 小时</li>
          <li><em>注册时间</em>2017-7-16 18:00</li>
          <li><em>最后访问</em>2018-6-26 18:00</li>
          <li><em>上次活动时间</em>2018-6-15 19:06</li>
          <li><em>上次发表时间</em>2018-5-26 18:11</li>
          <li><em>所在时区</em>使用系统默认</li>
         </ul>
        </div>

python正则怎么匹配第二段div
我想要这一坨

<div class="pbm mbm bbda cl">
         <h2 class="mbn">活跃概况</h2>
         <ul>
          <li> <em class="xg1">用户组&nbsp;&nbsp;</em><span style="color:#FF0000"><a href="http://bbs.aa.cc/home.php?mod=spacecp&amp;ac=usergroup&amp;gid=21" target="_blank"><font color="#FF0000">开发者</font></a></span> </li>
          <li><em class="xg1">扩展用户组&nbsp;&nbsp;</em>注册会员</li>
         </ul>
         <ul id="pbbs" class="pf_l">
          <li><em>在线时间</em>28 小时</li>
          <li><em>注册时间</em>2017-7-16 18:00</li>
          <li><em>最后访问</em>2018-6-26 18:00</li>
          <li><em>上次活动时间</em>2018-6-15 19:06</li>
          <li><em>上次发表时间</em>2018-5-26 18:11</li>
          <li><em>所在时区</em>使用系统默认</li>
         </ul>
        </div>
阅读 6.8k
2 个回答

最好用dom操作,不要用正则

新手上路,请多包涵

用lxml或者bs4,正则表达式很难匹配这种层级的内容

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题