pyspider爬虫 return无结果

问题描述

pyspider 是最新版本,

问题出现的环境背景及自己尝试过哪些方法

重新再GitHub上安装过最新的spider,使用的python3.6版本

相关代码

// 请把代码文本粘贴到下方(请勿用图片代替代码)

#!/usr/bin/env python
# -*- encoding: utf-8 -*-
# Created on 2018-07-13 15:59:53
# Project: TripAdvisor
from pyspider.libs.base_handler import *
import pymongo
class Handler(BaseHandler):
    
    crawl_config = {
    }
    client=pymongo.MongoClient('localhost')
    db=client['trip']

    @every(minutes=24 * 60)
    def on_start(self):
        
        self.crawl('https://www.tripadvisor.cn/Attractions-g186338-Activities-c47-t163-London_England.html', callback=self.index_page,validate_cert=False)
      

    @config(age=10 * 24 * 60 * 60)
    def index_page(self, response):
        for each in response.doc('#ATTR_ENTRY_ > div.attraction_clarity_cell > div > div > div.listing_info > div.listing_title > a').items():
            self.crawl(each.attr.href, callback=self.detail_page)

    @config(priority=2)
    def detail_page(self, response):
        url=response.url
        name=response.doc('.heading_title').text()
        rating=response.doc('div > .more').text()
        address=response.doc('.location > .address').text()
        phone=response.doc('.phone > div').text()
        duration=response.doc('.hours > .duration').text()
        
        return {
            'name':name,
            'rating':rating,
            'address':address,
            'phone':phone,
            'duration':duration,
            "url": url
            
        }
    def on_result(self,result):
        if result:
            self.save_to_mongo(result)
       
    def save_to_mongo(self,result):
        if self.db['london'].insert(result):
            print('saved to mongo',result)

你期待的结果是什么?实际看到的错误信息又是什么?

阅读 1.4k
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题