response = requests.get(url=url, headers=headers)
html = response.text
一段img代码<img src="//img.jandan.net/img/blank.gif" onload="jandan_load_img(this)">
jandan_load_img(this)方法调用之前
<img src="//img.jandan.net/img/blank.gif" onload="jandan_load_img(this)">
jandan_load_img(this)方法调用之后
<img src="http://wx2.sinaimg.cn/mw600/0076BSS5ly1g16285cyk4j30hw0qwk33.jpg" style="max-width: 480px; max-height: 750px;">
是通过img标签是通过jandan_load_img(this)方法调用获得的url
这怎么办??
不能怎么办,要么你自己看懂这段逻辑,用python实现了,要么你干脆用真实的浏览器去发起请求,然后抓取返回的结果,利用真实的浏览器去执行js,渲染页面,抓取你所要的部分,后者可以用selenium实现