Scrapy一个非常奇怪的问题利用scrapy shell访问得到的网页与用浏览器访问不一致

Question

Scrapy一个非常奇怪的问题利用scrapy shell访问得到的网页与用浏览器访问不一致

发布于
2020-03-21

更新于
2020-03-21

新手上路，请多包涵

如图利用xpath对该链接定位提取url调用yield进行下一步的爬取
scrapy shell然后用xpath定位得到的网址是P2点进去是P4
利用浏览器访问得到的页面是P3
也就是说scrapy发起request得到的response并不与浏览器直接访问一致，请问这个问题的原因是什么？
发现这个问题起因是看到房源数据是13000套，然而我整个爬虫爬完也就3000多条数据，于是就拿scrapy shell试了一下，我看到有类似的提问也没有解决。求大佬指点一下问题在哪

scrapy python爬虫 pac

阅读 2.1k

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

Scrapy一个非常奇怪的问题利用scrapy shell访问得到的网页与用浏览器访问不一致

你尚未登录，登录后可以

浏览器能请求到数据怎么换了api工具或是爬虫都没数据了呢？

win11上跑 scrapy爬虫脚本，一直报错 'gbk' codec can't decode byte 0xae in position 324:？

Scrapy一个非常奇怪的问题 利用scrapy shell访问得到的网页与用浏览器访问不一致

你尚未登录，登录后可以

浏览器能请求到数据怎么换了api工具或是爬虫都没数据了呢？

win11上跑 scrapy爬虫脚本，一直报错 'gbk' codec can't decode byte 0xae in position 324:？

Scrapy一个非常奇怪的问题利用scrapy shell访问得到的网页与用浏览器访问不一致