beautifulsoup4爬取问题

我想用beautifulsoup4爬取图片中箭头指向的557这个数值,不知道该怎么提取呢
爬取的链接为requrl = 'http://apply.sztb.gov.cn/appl...'
clipboard.png
向各位大佬求教一下

阅读 2.5k
2 个回答

用selenium 和 PhantomJS:

from bs4 import BeautifulSoup
from selenium import webdriver
import re

url = "http://apply.sztb.gov.cn/apply/app/status/norm/person"
driver = webdriver.PhantomJS()
driver.get(url)

page_content = BeautifulSoup(driver.page_source,"lxml")
page_count_content = page_content.find("li",class_="prev disabled")

page = page_count_content.a.text.split("/")[1]

total = re.findall(r'\d*',page)

print(total)

结果:

['432', '', '']

这个内容在script里,需要用正则表达式来匹配了

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题