一个爬取数据入数据库(更新数据入库)的问题

关于数据库我是个新手,现在遇到一个问题,我想知道如何处理这个问题。
问题:
我在爬取豆瓣的正在上映电影存入数据库后,下次再次爬取时,他的正在上映电影条目已经更改了,所以数据库的内容要进行相应的更改(跟豆瓣的同步)。
已知:
1.爬取条目后创建的顺序是按照热度的排序,但那个热度我无法捉取到(只能从别的电影票房网捉取)
2.电影上映的时间结束后,从豆瓣里爬取不到该条目,所以数据库关于该电影的条目要进行删除
请问我该怎么更新(设计)数据入库比较好?或者每次爬取时,删除数据库的数据,再把数据存入数据库

阅读 2.5k
1 个回答
新手上路,请多包涵

这个很简单啊 对采集的电影数据加上一个当前采集日期的字段 查询的时候按照采集日期查询
这样还可以保存历史记录

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题