UnicodeDecodeError:“utf8”编解码器无法解码位置 0 中的字节 0xa5:起始字节无效

新手上路,请多包涵

我正在使用 Python-2.6 CGI 脚本,但在执行 json.dumps() 时在服务器日志中发现此错误,

 Traceback (most recent call last):
  File "/etc/mongodb/server/cgi-bin/getstats.py", line 135, in <module>
    print json.dumps(​​__get​data())
  File "/usr/lib/python2.7/json/__init__.py", line 231, in dumps
    return _default_encoder.encode(obj)
  File "/usr/lib/python2.7/json/encoder.py", line 201, in encode
    chunks = self.iterencode(o, _one_shot=True)
  File "/usr/lib/python2.7/json/encoder.py", line 264, in iterencode
    return _iterencode(o, 0)
UnicodeDecodeError: 'utf8' codec can't decode byte 0xa5 in position 0: invalid start byte

在这里,

​__get​data() 函数返回 dictionary {}

在发布这个问题之前,我已经提到 了这个 问题 os SO。


更新

下一行正在伤害 JSON 编码器,

 now = datetime.datetime.now()
now = datetime.datetime.strftime(now, '%Y-%m-%dT%H:%M:%S.%fZ')
print json.dumps({'current_time': now}) # this is the culprit

我得到了一个临时修复

print json.dumps( {'old_time': now.encode('ISO-8859-1').strip() })

但我不确定这样做是否正确。

原文由 Deepak Ingole 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 668
2 个回答

错误是因为字典中有一些非ascii字符,无法对其进行编码/解码。避免此错误的一种简单方法是使用 encode() 函数对此类字符串进行编码,如下所示(如果 a 是具有非 ASCII 字符的字符串):

 a.encode('utf-8').strip()

原文由 Santosh Ghimire 发布,翻译遵循 CC BY-SA 3.0 许可协议

我通过在 read_csv() 命令中定义不同的编解码器包来简单地切换它:

encoding = 'unicode_escape'

例如:

 import pandas as pd
data = pd.read_csv(filename, encoding= 'unicode_escape')

原文由 MSalty 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题