scrapy中如何传递start_url到数据库？

发布于
2020-02-09

我的爬虫会爬取一个start_urls列表，那么如何在存储每条数据时，同时把它对应的start_url也存下来？

部分代码：

Nature_journals_rss = {  
    'Nat Chem': 'http://feeds.nature.com/nchem/rss/current',  
    'Nat Methods': 'http://feeds.nature.com/nmeth/rss/current',  
    'Nat Protoc': 'http://feeds.nature.com/nprot/rss/current',  
}  
start_urls = list(Nature_journals_rss.values())

网页爬虫 scrapy

python