Python 3.6中 'utf-8' codec can't decode byte invalid start byte?

Python 3.6中，网页信息解析失败，试了很多种编码，查看网页的编码方式也是utf-8。
错误信息：'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte?
还有就是第一个print终端里打印出来的unicode内容是[b'\x1f\x8b\x08\x00\x...]这种格式的，之前也有过这种情况，一个print打2个变量，就是b'\x, 如果分来2行打又变回了汉字。是因为什么原因呢？

# -*- coding: utf-8 -*-
import json , sqlite3
import urllib.request

url = ('http://wthrcdn.etouch.cn/weather_mini?city=%E4%B8%8A%E6%B5%B7')
resp = urllib.request.urlopen(url)
content = resp.read()

print(content)
print(type(content))
print(content.decode('utf-8'))

python 编码 utf-8

阅读 21.7k

4 个回答

得票最新

lossme

47014

发布于
2017-03-10

✓ 已被采纳

图片描述

看了一下网站返回的是gzip压缩过的数据，所以要进行解码

# coding=utf-8
from io import BytesIO
import gzip
import urllib.request

url = ('http://wthrcdn.etouch.cn/weather_mini?city=%E4%B8%8A%E6%B5%B7')
resp = urllib.request.urlopen(url)
content = resp.read() # content是压缩过的数据

buff = BytesIO(content) # 把content转为文件对象
f = gzip.GzipFile(fileobj=buff)
res = f.read().decode('utf-8')
print(res)

图片描述

prolifes

11.2k51537

发布于
2017-03-09

requests不好用吗？

如是我闻C

15271929

发布于
2017-03-09

建议用requeset，代码如下：

import requests

r = requests.get('http://wthrcdn.etouch.cn/weather_mini?city=%E4%B8%8A%E6%B5%B7')
print(r.text)

浮生若梦的编程

2.8k30282345

发布于
2017-03-10

不是字符编码问题, 你看看你请求的 Respont headers



    Status Code: 200 OK
    Access-Control-Allow-Headers: *
    Access-Control-Allow-Methods: *
    Access-Control-Allow-Origin: *
    Cache-Control: must-revalidate, max-age=300
    Connection: Keep-Alive
    Content-Encoding: gzip
    Content-Length: 443
    Date: Fri, 10 Mar 2017 03:20:46 GMT
    Fw-Cache-Status: hit
    Fw-Via: HTTP MISS from 58.59.19.99, DISK HIT from 183.131.161.27
    Server: Tengine/2.1.2

是gzip, 如果用标准库的东西, 还需要把gzip 给解开

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

Python 3.6中 'utf-8' codec can't decode byte invalid start byte?

你尚未登录，登录后可以

学信网的前端使用了什么技术隐藏字符？

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

如何实现一个深拷贝函数？

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？