beautifulsoup4爬取问题

kulo

361715

发布于
2017-09-27

我想用beautifulsoup4爬取图片中箭头指向的557这个数值，不知道该怎么提取呢
爬取的链接为requrl = 'http://apply.sztb.gov.cn/appl...'

向各位大佬求教一下

python

阅读 2.6k

2 个回答

得票最新

chqbge

24728

发布于
2017-09-27

✓ 已被采纳

用selenium 和 PhantomJS：

from bs4 import BeautifulSoup
from selenium import webdriver
import re

url = "http://apply.sztb.gov.cn/apply/app/status/norm/person"
driver = webdriver.PhantomJS()
driver.get(url)

page_content = BeautifulSoup(driver.page_source,"lxml")
page_count_content = page_content.find("li",class_="prev disabled")

page = page_count_content.a.text.split("/")[1]

total = re.findall(r'\d*',page)

print(total)

结果：