scrapy 运行的过程中，为什么中间会有很长时间的停顿？

看近行远

271869110

发布于
2019-04-19

如图，这中间十分钟干啥了...

emmm....猜测了一下，有可能是上面最后一条链接连接的时间太长了？但是也不至于10分钟吧，也没个超时啥的
或者是重试（Retrying）耗费的时间太久了？
会不会有可能是处理了301导致的呢？

这中间将近七分钟，都干啥了...

观测了一下，好像只有scrapy.extensions.logstats在这个时候，才会长时间停顿...
百度了一下scrapy.extensions.logstats并没有相关结果...

python

阅读 4.4k

3 个回答

慕辰先生

在不考虑代码本身性能的情况下，影响爬虫速度的因素
1、网速，如果你的网速就很慢，就不用说了。
2、反爬虫机制，有的网站会分析用户行为，针对请求非常频繁的IP做一些限制处理，以减轻服务器压力。
3、硬件性能，这个很好理解了，简单的例子就是酷睿i3和i7的差距了，如果期间你还有读写操作，就跟硬盘读写速度也有关了。