需求:
抓取网站目录结构的爬虫,发送http请求这部分 交给一个请求队列执行。
使用requests库手动发送请求也可以交给队列执行,然后返回request和response对象。
使用请求队列主要是为了统一控制爬虫和requests库发送频率
求推荐合适的爬虫和结合使用这样的请求队列
python新手,希望各位在解决问题的思路和方向上不吝赐教。
需求:
抓取网站目录结构的爬虫,发送http请求这部分 交给一个请求队列执行。
使用requests库手动发送请求也可以交给队列执行,然后返回request和response对象。
使用请求队列主要是为了统一控制爬虫和requests库发送频率
求推荐合适的爬虫和结合使用这样的请求队列
python新手,希望各位在解决问题的思路和方向上不吝赐教。
1 回答9.4k 阅读✓ 已解决
2 回答5.1k 阅读✓ 已解决
2 回答3.4k 阅读✓ 已解决
3 回答4.4k 阅读
2 回答2.4k 阅读✓ 已解决
2 回答1.4k 阅读✓ 已解决
1 回答2.7k 阅读✓ 已解决
简单的话直接用redis的list就好了,一进一出