【新手求救】scrapy：根据xpath爬取爬虫获取的结果为空

python新手最近在学习scrapy爬取网站，就先找一个网站爬取一些东西

爬取网站为：http://www.acfun.tv/a/ac2643312

我想爬取的内容为评论，就爬取评论作者reviewer 和评论内容content

可是我print sites的内容发现为空 []
sites = sel.xpath('//div[@id="area-comment-inner"]/div/div')
出现错误 DEBUG: Crawled (200) <GET http://www.acfun.tv/a/ac2643312> (referer: None)

我想请教下各位 xpath 格式是否正确，该怎么样改，谢谢！
还有请求各位给我一些关于学习Python爬虫在方向和方法上一点指引！谢谢各位！

class AcfunSpider(Spider):
    name = "acfun"
    allowed_domains = ["acfun.tv"]
    start_urls = [
        "http://www.acfun.tv/a/ac2643312"
    ]

    def parse(self, response):

        sel = Selector(response)
        sites = sel.xpath('//div[@id="area-comment-inner"]/div/div')
        print sites
        items = []

        for site in sites:
            item = W3SchoolItem()
            reviewer= site.xpath('div[2]/text()').extract()  
            content= site.xpath('div[1]/a/text()').extract()      

            item['reviewer'] = [r.encode('utf-8') for r in reviewer]
            item['content'] = [c.encode('utf-8') for c in content]
            items.append(item)

            log.msg("Appending item...",level='INFO')

        log.msg("Append done.",level='INFO')
        return items

通过Firefox的xpath checker检验抓取的内容发现xpath也没问题，是正确
的，但是为什么不对呢？？

阅读 11k

【新手求救】scrapy：根据xpath爬取爬虫获取的结果为空

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

如何使用 python 代码实现迅雷磁力链接资源的下载？

如何实现一个深拷贝函数？

请问，FastAPI如何获取到前端上传的二进制文件并且返回？

浏览器能请求到数据怎么换了api工具或是爬虫都没数据了呢？

Python 成员变量在多个子类实例间共享，如何避免？