一只爬虫如果每天勤劳工作,一年以后,已经爬取了上亿的数据,此时redis也同步存放了上亿的url,内存说不定去到了10G以上,请问各位大神,一般使用了redis去重机制之后,是不是数据就一直存放在redis里面?
还是说,可以有啥办法适当删除一部分数据达到优化效果,不然这样下去内存早晚得奔溃
一只爬虫如果每天勤劳工作,一年以后,已经爬取了上亿的数据,此时redis也同步存放了上亿的url,内存说不定去到了10G以上,请问各位大神,一般使用了redis去重机制之后,是不是数据就一直存放在redis里面?
还是说,可以有啥办法适当删除一部分数据达到优化效果,不然这样下去内存早晚得奔溃
4 回答4.4k 阅读✓ 已解决
4 回答3.8k 阅读✓ 已解决
1 回答3k 阅读✓ 已解决
3 回答2.1k 阅读✓ 已解决
1 回答4.5k 阅读✓ 已解决
1 回答3.8k 阅读✓ 已解决
1 回答2.8k 阅读✓ 已解决
redis数据库一般作为数据缓存的地方比较好,redis存入的数据,尽量少用长久保存的,这样会降低查询效率。如果数据较少当然没问题,如果是大型数据的入库保存最好的选择是MySQL,或者MongoDB比较好。