Python正则表达式问题

我要匹配html的一个<div class>这个标签,但是这个网页里有很多其他的div标签,比如<div class='article'>这样的标签。我不需要其他的div,我就要匹配div class,那么该如何匹配?
图片描述

阅读 3.7k
6 个回答

可以试试 beautifulsoup

BeautifulSoup指哪打哪.

from bs4 import BeautifulSoup
soup = BeautifulSoup(html,"lxml")
art = soup.find("div",attrs={"class":"article"})
print art

建议使用XPath

额,你用的解析库是什么呢?不是直接用正则解析整个页面吧?把问题描述详细点

^\<div class\>$

利用行首、行尾限定符来精确匹配即可。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题