scrapy可以用多线程去爬取吗？

发布于
2016-07-15

目前在单核cpu下测试，想多爬取一些网站，但是scrapy是基于twisted的single-threading。

能否使用多线程？

我的思路：

给每个spider开辟一个thread，在这个线程里完成请求(start_requests)、解析(parse)、入库(pipelines)等动作。

可行否？

scrapy 多线程

阅读 13.6k

1 个回答

发布于
2016-07-24

scrapy是 single-thread 不过应该可以设定同时跑几只 spider

CONCURRENT_REQUESTS

http://doc.scrapy.org/en/late...

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

win11上跑 scrapy爬虫脚本，一直报错 'gbk' codec can't decode byte 0xae in position 324:？
之前一直是好好的，代码也没变过，突然就报这个错误，并且在mac上是好的，我把win11上的代码移除重新从仓库里拉代码下拉也是一样的错误，是不是win上文件编码必须是gbk格式的。我用vscode编辑器右下角显示所有的文件都是UTF-8的，是不是都要把它转成gbk？
1 回答1.1k 阅读

相似问题

找不到问题？创建新问题