只想提取下一页上的href啊!
我简单说一下
ul = soup.find('div',attr={'class':'page'}).ul
lis = ul.find_all('li')
next = lis[-2]['href']
因为下一页在倒数第二个,直接[-2],得到href属性即可
爬虫写的不多,函数可能用的不对,但大致思路差不多。
4 回答4.5k 阅读✓ 已解决
1 回答3.3k 阅读✓ 已解决
4 回答3.8k 阅读✓ 已解决
3 回答2.2k 阅读✓ 已解决
1 回答4.5k 阅读✓ 已解决
1 回答3.9k 阅读✓ 已解决
1 回答2.8k 阅读✓ 已解决
这个很明显了吧,
下一页是list_1_2.html,最后一页是list_1_117.html
中间页数是3到116啊
用一个for循环