requests源码里面提到,响应头content-type里面如果有text的话,返回类型是ISO-8859-1,所以你可以这样试试(亲测好用)。
response = requests.request('GET', url)
response.encoding=None
response.text
4 回答4.4k 阅读✓ 已解决
4 回答3.8k 阅读✓ 已解决
1 回答3k 阅读✓ 已解决
3 回答2.1k 阅读✓ 已解决
1 回答4.5k 阅读✓ 已解决
1 回答3.8k 阅读✓ 已解决
1 回答2.8k 阅读✓ 已解决
爬虫下来是有编码格式的
比如你爬下来的是text
print text # 是乱码, 假如type(text) 是str
print text.decode('gbk') # gbk可以换成latin1,utf-8,utf-16,gb2312等编码,最好是能获取网页的编码,requests库支持爬虫后获取网页编码requests.get(url).encoding