我的字符串是 Niệm Bồ Tát (Thiá»n sư Nhất Hạnh)
我想将它解码为 Niệm Bồ Tát (Thiền sư Nhất Hạnh)
。我在那个网站上看到可以做到这一点 http://www.enderminh.com/minh/utf8-to-unicode-converter.aspx
我开始尝试使用 Python
mystr = '09. Bát Nhã Tâm Kinh'
mystr.decode('utf-8')
但实际上这是不正确的,因为原始字符串是 utf-8 但字符串显示不是我期望的结果。
注意:是越南字。
那个案子怎么解决?那是 Windows Unicode 还是什么?如何在这里检测编码。
原文由 giaosudau 发布,翻译遵循 CC BY-SA 4.0 许可协议
我不确定您可以用这些数据做什么,但是对于您在原始帖子中的示例,这是有效的(Python 3.x):