python怎么用正则怎么获取标题

<h3 class="title h1 js-title"> <a href="/out/7561938" target="426428" data-main-tab="/out/7561938" data-new-tab="view/dji.com?c=7561938"> $300 Off Phantom 3 Standard </a> </h3>
阅读 2.9k
2 个回答

反向思维, 从标签中找到文本很麻烦, 所以我们干脆就把别的标签都干掉

import re
html = u'<h3 class="title h1 js-title"> <a href="/out/7561938" target="426428" data-main-tab="/out/7561938" data-new-tab="view/dji.com?c=7561938"> $300 Off Phantom 3 Standard </a> </h3>'
title = re.sub(ur'<.+?>', '', html).strip()
print title # $300 Off Phantom 3 Standard
import re
html = u'<h3 class="title h1 js-title"> <a href="/out/7561938" target="426428" data-main-tab="/out/7561938" data-new-tab="view/dji.com?c=7561938"> $300 Off Phantom 3 Standard </a> </h3>'
print re.search(r'(?<=\d">\s).+?(?=</a>)',html).group(0)

前提是view/dji.com?c=xx 中的xx总是数字

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题
宣传栏