使用pyspider采集那些入库有顺序要求的页面该怎么写?

RainLee
  • 4
新手上路,请多包涵

对于入库顺序有要求的数据在pyspider采集的时候该如何写?如采集手册或书籍章节内容,正常来说应该是第一章采集入库后在采集第二章,但是pyspider采集顺序是乱的,这种该如何解决?哪位大神给回答一下。谢谢。。。

回复
阅读 1.3k
2 个回答

这属于数据清洗吧, 第一章 应该有当前书籍的 章数 序列吧

目前就想到1个办法,一先入库,取返回值再写文本,二,先写到内存,最后统一入库

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
你知道吗?

宣传栏