在python中,如何获取短链对应最终网址,现在有很多淘宝短链,我需要获取短链跳到的最终网址,这个有什么好办法吗?有的是302 有的是直接在网页用js进行跳转,,这些如何获取
在python中,如何获取短链对应最终网址,现在有很多淘宝短链,我需要获取短链跳到的最终网址,这个有什么好办法吗?有的是302 有的是直接在网页用js进行跳转,,这些如何获取
可以试试轻量级mechanize库,但不支持JS类的重定向
pip install mechanize
# _*_ coding:utf-8 _*_
import mechanize
br = mechanize.Browser()
br.set_handle_equiv(True) # 设置是否处理HTML http-equiv标头
br.set_handle_redirect(True) # 设置是否处理重定向
br.set_handle_referer(True) # 设置是否向每个请求添加referer头
br.set_handle_robots(False) # 设置是不遵守robots中的规则
br.set_handle_gzip(False) # 处理giz传输编码
br.addheaders = [('User-Agent', 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36')]
source_url = ""
response=br.open(source_url)
target_url=response.geturl()
print("source_url=" + source_url)
print("target_url=" + target_url)
4 回答4.5k 阅读✓ 已解决
1 回答3.4k 阅读✓ 已解决
4 回答3.9k 阅读✓ 已解决
3 回答2.2k 阅读✓ 已解决
1 回答4.6k 阅读✓ 已解决
2 回答511 阅读✓ 已解决
1 回答4k 阅读✓ 已解决
用selenium+phantonjs...
http://stackoverflow.com/ques...
而且可以试试pip包
https://pypi.python.org/pypi/...