只想提取下一页上的href啊!
我简单说一下
ul = soup.find('div',attr={'class':'page'}).ul
lis = ul.find_all('li')
next = lis[-2]['href']
因为下一页在倒数第二个,直接[-2],得到href属性即可
爬虫写的不多,函数可能用的不对,但大致思路差不多。
2 回答5.1k 阅读✓ 已解决
2 回答1.1k 阅读✓ 已解决
4 回答980 阅读✓ 已解决
3 回答1.1k 阅读✓ 已解决
3 回答1.2k 阅读✓ 已解决
1 回答1.7k 阅读✓ 已解决
1 回答1.2k 阅读✓ 已解决
这个很明显了吧,
下一页是list_1_2.html,最后一页是list_1_117.html
中间页数是3到116啊
用一个for循环