带有 scrapy 的 while 循环中的 ReactorNotRestartable 错误

社区维基

发布于
2023-01-10

新手上路，请多包涵

执行以下代码时出现 twisted.internet.error.ReactorNotRestartable 错误：

 from time import sleep
from scrapy import signals
from scrapy.crawler import CrawlerProcess
from scrapy.utils.project import get_project_settings
from scrapy.xlib.pydispatch import dispatcher

result = None

def set_result(item):
    result = item

while True:
    process = CrawlerProcess(get_project_settings())
    dispatcher.connect(set_result, signals.item_scraped)

    process.crawl('my_spider')
    process.start()

    if result:
        break
    sleep(3)

第一次它起作用，然后我得到错误。我每次都创建 process 变量，这是什么问题？

原文由 k_wit 发布，翻译遵循 CC BY-SA 4.0 许可协议

python python-2.7 scrapy twisted

阅读 1.5k

1 个回答

社区维基

发布于
2023-01-10

默认情况下， CrawlerProcess 的 .start() 将在所有爬虫完成后停止它创建的 Twisted 反应器。

如果在每次迭代中创建 process ，则应调用 process.start(stop_after_crawl=False) 。

另一种选择是自己处理 Twisted 反应器并使用 CrawlerRunner 。文档有一个这样做的例子。

原文由 paul trmbrth 发布，翻译遵循 CC BY-SA 3.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

Stack Overflow 翻译

子站问答

本篇内容翻译自 Stack Overflow，如果你觉得翻译结果值得改进，欢迎直接编辑修改，感谢你为社区贡献。

相似问题

找不到问题？创建新问题