前段时间在我的星球交流群里,有小伙伴问如何使用XPath的定位获取到小红书的图片。今天咱们就来安排。

教程(本次教程基于edge浏览器)

如果你还不知道什么是XPath,你可以先百度了解下:https://www.runoob.com/xpath/xpath-tutorial.html

其实这就是在一个有层级结构的文档中找到某个数据

1. 定位到小红书笔记的图片源码

  1. 打开某一个笔记的详情页

  1. 鼠标右击,选择检查,打开控制台。部分电脑也可以键盘上F12唤起浏览器控制台。
  2. 定位元素

2. 分析源码

分析源码,两张图片的源码中都有class="note-slider-img"

那么我们就可以根据这个属性来定位这篇笔记的所有图片。如果你不信,可以打开其他笔记,然后u根据上述方法来看,所有图片都有这个属性喔

3. 写代码

  1. 在影刀中,我们使用获取相似元素列表(web)来获取图片对象。

    XPath语法为:

    //*[contains(@class, 'note-slider-img')]

    这个语法的含义是:该页面中所有class属性包含note-slider-img的元素

4. 围绕获取的图片元素对象我们可以做很多事情了

  1. 我们可以获取图片的地址

    获取到该笔记下的所有图片地址

  2. 我们获取到元素的地址,可以使用影刀的下载文件命令进行下载我就不过多介绍了。

本文由mdnice多平台发布


搬砖的阿陆RPA
1 声望2 粉丝

所有应用全部在#共棕号(小绿书):搬砖的阿陆RPA