Python3 bytes转str失败?要如何解决?

我访问的网页明明是bytes代码

In [50]: type(html)
Out[50]: bytes

按照网上的方法,应该是这样转换的
str(html,"utf-8")
测试失败!
提示

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

然后又按照教程:
html.decode("UTF-8")

测试又失败
提示

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

然后也不知道错在哪里?
访问的是百度的源代码,是这样的结果:

clipboard.png

不知道有高人指点一下?

阅读 9.1k
4 个回答

如果是requests获取的话,
可以尝试
req = requests.get(url)
req.encoding = "utf-8"
或者
req.encoding = req.apparent_encoding

clipboard.png

如果是中文可以试试decode('gb18030')

说明不是utf8

试试 gbk

新手上路,请多包涵

chr()函数

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题