我的爬虫会爬取一个start_urls列表,那么如何在存储每条数据时,同时把它对应的start_url也存下来?
部分代码:
Nature_journals_rss = {
'Nat Chem': 'http://feeds.nature.com/nchem/rss/current',
'Nat Methods': 'http://feeds.nature.com/nmeth/rss/current',
'Nat Protoc': 'http://feeds.nature.com/nprot/rss/current',
}
start_urls = list(Nature_journals_rss.values())