需求:
抓取网站目录结构的爬虫,发送http请求这部分 交给一个请求队列执行。
使用requests库手动发送请求也可以交给队列执行,然后返回request和response对象。
使用请求队列主要是为了统一控制爬虫和requests库发送频率
求推荐合适的爬虫和结合使用这样的请求队列
python新手,希望各位在解决问题的思路和方向上不吝赐教。
需求:
抓取网站目录结构的爬虫,发送http请求这部分 交给一个请求队列执行。
使用requests库手动发送请求也可以交给队列执行,然后返回request和response对象。
使用请求队列主要是为了统一控制爬虫和requests库发送频率
求推荐合适的爬虫和结合使用这样的请求队列
python新手,希望各位在解决问题的思路和方向上不吝赐教。
4 回答4.4k 阅读✓ 已解决
4 回答3.8k 阅读✓ 已解决
1 回答3k 阅读✓ 已解决
3 回答2.1k 阅读✓ 已解决
1 回答4.5k 阅读✓ 已解决
1 回答3.8k 阅读✓ 已解决
1 回答2.8k 阅读✓ 已解决
简单的话直接用redis的list就好了,一进一出