pyspider爬虫页面包含懒加载lazy-load,获取不到数据

用pyspider获取芒果TV页面中热门综艺栏目内容('div.mg-main ul>li.v-item'),由于页面采用了懒加载模式,所以获取不到具体信息,怎么让页面去加载这部分内容,然后拿到数据呀?

阅读 7.1k
2 个回答

可通过设置self.crawl中的js_viewport_height属性值或者使用js_script解决

js_script 可以解决,window.scrollTo(document.body.scrollWidth, document.body.scrollHeight);

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进