爬虫如何获取onclick的链接

<a onclick="xxx(1)">xxxx</a>

类似如上这种需要点击一下才会打开一个网页的,这种链接该如何获取呢?
除了手工分析参数自己构造请求, selenium 定位模拟点击,还有什么方法么?

阅读 12.9k
3 个回答

如果js有做混淆或者加密,无法直接从代码中获取到链接的话,那只有模拟点击能做到了。

from bs4 import BeautifulSoup as bs

for a_tag in  bs(html_body,'html.parser').find_all('a'):
    print(a_tag['onclick'])
新手上路,请多包涵

正则表达式提取呗

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题