scrapy 派取任意日期下数据

Question

scrapy 派取任意日期下数据

ymoffice

21

发布于
2019-01-22

新手上路，请多包涵

问题描述

class MyspiderSpider(scrapy.Spider):

name = 'myspider'
allowed_domains = ['dszuqiu.com']
url = "https://www.dszuqiu.com"
offset = 0
start_urls = [url +'/diary/'+ (datetime.datetime(2018, 7, 31) + datetime.timedelta(days=offset)).strftime("%Y%m%d"), ]



def parse(self,response):
    item = DsItem()
    sonUrls = response.xpath("""//*[@id="pager"]/ul//@href""").extract()
    if self.offset < (datetime.datetime(2018, 7, 31) - datetime.datetime(2018, 7, 1)).days:
        self.offset += 1
        yield scrapy.Request(
            self.url +'/diary/'+ (datetime.datetime(2018, 7, 1) + datetime.timedelta(days=self.offset)).strftime(
                "%Y%m%d") , callback=self.parse)
        yield scrapy.Request( url= sonUrls,callback = self.parse2)

def parse2(self, response):
    print(response.url)
    pass

问题出现的环境背景及自己尝试过哪些方法

你期待的结果是什么？实际看到的错误信息又是什么？

题目描述

想爬取该网站下任意日期的完场数据。如果只是日期变量，已经解决。但深入发现网站某日期下是有页的，如何设置多页爬取？本人不是计算机专业，请大神指明道路。

题目来源及自己的思路

你期待的结果是什么？实际看到的错误信息又是什么？

问题描述

问题出现的环境背景及自己尝试过哪些方法

你期待的结果是什么？实际看到的错误信息又是什么？

python

阅读 1.1k

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

scrapy 派取任意日期下数据

问题描述

问题出现的环境背景及自己尝试过哪些方法

相关代码

你期待的结果是什么？实际看到的错误信息又是什么？

题目描述

题目来源及自己的思路

相关代码

你期待的结果是什么？实际看到的错误信息又是什么？

问题描述

问题出现的环境背景及自己尝试过哪些方法

相关代码

你期待的结果是什么？实际看到的错误信息又是什么？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

scrapy 派取任意日期下数据

问题描述

问题出现的环境背景及自己尝试过哪些方法

相关代码

你期待的结果是什么？实际看到的错误信息又是什么？

题目描述

题目来源及自己的思路

相关代码

你期待的结果是什么？实际看到的错误信息又是什么？

问题描述

问题出现的环境背景及自己尝试过哪些方法

相关代码

你期待的结果是什么？实际看到的错误信息又是什么？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。 请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？