爬虫使用了redis去重之后如何管理redis里面数据

一只爬虫如果每天勤劳工作,一年以后,已经爬取了上亿的数据,此时redis也同步存放了上亿的url,内存说不定去到了10G以上,请问各位大神,一般使用了redis去重机制之后,是不是数据就一直存放在redis里面?
还是说,可以有啥办法适当删除一部分数据达到优化效果,不然这样下去内存早晚得奔溃

阅读 4.7k
1 个回答

redis数据库一般作为数据缓存的地方比较好,redis存入的数据,尽量少用长久保存的,这样会降低查询效率。如果数据较少当然没问题,如果是大型数据的入库保存最好的选择是MySQL,或者MongoDB比较好。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题