python scrapy 采集百度贴吧入库mysql后。入库数据时间上是混乱的,有什么办法可以按百度贴吧发贴时间入库不?

python scrapy 采集百度贴吧入库mysql后。入库数据是混乱的,有什么办法可以按百度贴吧发贴时间入库不?

如图:

图片描述

后面的这一列时间。是我采集的百度贴吧楼主发贴的时间。入库后发现这个时间好混乱。有今天的,昨天的。上个月的。。。。

如果想把百度贴吧发贴的时间顺序入库。

请问实现这个需要什么思路?

阅读 4.6k
3 个回答

没有办法吧?除非你把抓到的无序数据都缓存起来做个排序再写进数据库,不过数据库取数据本来就有order by,请问楼主为什么要执着于写入顺序呢?

你都拿到发帖时间了,排序不久行了吗

把时间值由字符串转化为时间值,排序吧

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题