重复采集怎么实现,例如每隔 20分钟
定时采集怎么实现 例如每天的6点采集
schedule很好用
def crawl_work():
# cmdline.execute('scrapy crawl my_spider'.split()) # 不要用自带的cmdline
subprocess.Popen('scrapy crawl my_spider') # Execute a child program in a new process.
if __name__=='__main__':
schedule.every(1).minutes.do(crawl_work)
while True:
schedule.run_pending()
time.sleep(1)
可以使用定时任务调度实现,比如:
APScheduler Documentation