在python爬虫里, 如何提取一个页面内的多个图片链接?

最近在网上找了个教程学习python爬虫, 遇到一个问题, 如下:

  • 页面 https://mmzztt.com/photo/62578
  • 这个页面有很多张图片
  • 这些图片的浏览形式是, 点击图片左侧-上一张, 点击右侧-下一张,似乎是用js控制.
  • 不像常规页面那样, 所有图片都可以通过循环拼接截取得到完整的链接.

像这种情况, 如何提取一个页面内的多个图片链接呢?


image.png

阅读 3.4k
2 个回答

可以根据上一级路由入手,一次采集多张图片+翻页做到批量采集

image.png

可以看得出来该网站使用js分次请求图片
并且请求的图片格式为"图集ID+m+图片ID+随机字母.jpg"

提一个比较麻烦的方法,根据网络请求获取到该图集的图集ID,然后循环从0开始,使用requests把每一个字母都试一遍,返回403(这个网站只返回403)就跳过,返回200就是正确的图片)

(还有老哥注意身体)

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题