用python如何爬取网页的canvas元素(据说可以保存为图片再爬取)

前段时间写个爬虫玩,
要实时爬取从三个主要门进入卢浮宫所需要的时间, (就是下图的那几个"5min")
]
我本以为是个十分简单的 p 元素,
结果,
结果,
结果是个canvas元素,
我: ？？？？？
爬了这么些时间,
第一次碰见爬这玩意的,
用某度搜了N久,
无果,
求大佬指点,
爬取网址:神奇的卢浮宫
附上其Xpath:

/html/body/div[1]/div[2]/div[2]/canvas

前端网页爬虫

html5

python

阅读 16.5k

2 个回答

laoLiueizo

✓ 已被采纳

无头浏览器+截图吧这种方案应该是可以的

编辑一下

看了一下

https://webapi.affluences.com/api/waitingTime?token=5aFsg49pHOEQBH&callback=callback_8&uuid=5b17d545-a61a-496d-8d43-b6593f03e213

这是他的状态访问API 用的JSONP token来自于你那一个Canvas父元素元素上的data-token。

想看这请求的具体内容自己去网络面板看吧

冯恒智

7.9k2428

发布于
2019-02-02

更新于
2019-02-02

splash
Phantompy
https://github.com/dhamaniasa...

像你说的这种需求，需要你了解一些前端知识，去获取到canvas中显示的5min的数据来源（比如ajax或服务端渲染把原始数据写在网页中）

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

用python如何爬取网页的canvas元素(据说可以保存为图片再爬取)

你尚未登录，登录后可以

js 如何将Key属性相同的放在同一个数组？

如何防止接口的 key 泄露?

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

想在H5项目，Vue3中实现扫一扫的功能，怎么实现比较好？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

请问开发React Native，一般是推荐哪个主流的UI库呢？

在购买页面，这里有： for 1 month, for 3 months，这里说的意思是什么呢？