请问pyspider怎么爬有规律的url，内容为json格式的网页

Question

请问pyspider怎么爬有规律的url，内容为json格式的网页

发布于
2018-04-26

新手上路，请多包涵

例如有10个url为:
http://www.baidu.com/userid=1
http://www.baidu.com/userid=2
http://www.baidu.com/userid=3
...
http://www.baidu.com/userid=10

网页内容为

{
    "data": {
        "1": {
            "uid": "1",
            "phone": "13000000000",
            "sex": "1"
        }
    },
    "code": 1,
    "msg": "1"
}

{
    "data": {
        "2": {
            "uid": "2",
            "phone": "13000000001",
            "sex": "1"
        }
    },
    "code": 1,
    "msg": "1"
}

初学pyspider查了很多资料还没上手，查到一个方法可以列出所有url但是不知道怎么抓里面的数据，麻烦大家帮小弟解惑谢谢！！！

    def __init__(self):
        self.base_url = 'http://www.baidu.com/userid='
        self.uid_num = 1
        self.total_num = 10
 
    @every(minutes=24 * 60)
    def on_start(self):
        while self.uid_num <= self.total_num:
            url = self.base_url + str(self.uid_num)
            print url
            self.crawl(url, callback=self.index_page)
            self.uid_num += 1

pyspider 网页爬虫

阅读 1.9k

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

怎么在pycharm中断点调试 pyspider的脚本？
如题，怎么在pycharm中断点调试 pyspider的脚本？
1.4k 阅读

相似问题

找不到问题？创建新问题

请问pyspider怎么爬有规律的url，内容为json格式的网页

你尚未登录，登录后可以

怎么在pycharm中断点调试 pyspider的脚本？