前段时间在我的星球交流群里,有小伙伴问如何使用XPath的定位获取到小红书的图片。今天咱们就来安排。
教程(本次教程基于edge浏览器)
如果你还不知道什么是XPath,你可以先百度了解下:https://www.runoob.com/xpath/xpath-tutorial.html
其实这就是在一个有层级结构的文档中找到某个数据
1. 定位到小红书笔记的图片源码
- 打开某一个笔记的详情页
- 鼠标右击,选择
检查
,打开控制台。部分电脑也可以键盘上F12唤起浏览器控制台。 - 定位元素
2. 分析源码
分析源码,两张图片的源码中都有class="note-slider-img"
那么我们就可以根据这个属性来定位这篇笔记的所有图片。如果你不信,可以打开其他笔记,然后u根据上述方法来看,所有图片都有这个属性喔
3. 写代码
在影刀中,我们使用获取相似元素列表(web)来获取图片对象。
XPath语法为:
//*[contains(@class, 'note-slider-img')]
这个语法的含义是:该页面中所有class属性包含
note-slider-img
的元素
4. 围绕获取的图片元素对象我们可以做很多事情了
我们可以获取图片的地址
获取到该笔记下的所有图片地址
- 我们获取到元素的地址,可以使用影刀的下载文件命令进行下载我就不过多介绍了。
本文由mdnice多平台发布
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。