这是我的代码,
for line in open('u.item'):
# Read each line
每当我运行此代码时,它都会出现以下错误:
UnicodeDecodeError:“utf-8”编解码器无法解码位置 2892 中的字节 0xe9:无效的继续字节
我试图解决这个问题并在 open() 中添加一个额外的参数。代码如下所示:
for line in open('u.item', encoding='utf-8'):
# Read each line
但它又给出了同样的错误。那我该怎么办?
原文由 SujitS 发布,翻译遵循 CC BY-SA 4.0 许可协议
正如 Mark Ransom 所建议的,我找到了解决该问题的正确编码。编码是
"ISO-8859-1"
,所以用open("u.item", encoding="utf-8")
替换 ---open('u.item', encoding = "ISO-8859-1")
将解决问题。