requests源码里面提到,响应头content-type里面如果有text的话,返回类型是ISO-8859-1,所以你可以这样试试(亲测好用)。
response = requests.request('GET', url)
response.encoding=None
response.text
2 回答4.3k 阅读✓ 已解决
2 回答869 阅读✓ 已解决
1 回答4.1k 阅读✓ 已解决
3 回答871 阅读✓ 已解决
2 回答2.2k 阅读✓ 已解决
4 回答2.6k 阅读
3 回答913 阅读✓ 已解决
爬虫下来是有编码格式的
比如你爬下来的是text
print text # 是乱码, 假如type(text) 是str
print text.decode('gbk') # gbk可以换成latin1,utf-8,utf-16,gb2312等编码,最好是能获取网页的编码,requests库支持爬虫后获取网页编码requests.get(url).encoding