将 Unicode 字符串转换为 Python 中的字符串(包含额外符号)

新手上路,请多包涵

如何将 Unicode 字符串(包含额外的字符,如 £ $ 等)转换为 Python 字符串?

原文由 William Troup 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 545
2 个回答

unicodedata.normalize

 title = u"Klüft skräms inför på fédéral électoral große"
import unicodedata
unicodedata.normalize('NFKD', title).encode('ascii', 'ignore')
'Kluft skrams infor pa federal electoral groe'

原文由 Sorantis 发布,翻译遵循 CC BY-SA 4.0 许可协议

如果不需要翻译非 ASCII 字符,可以使用 encode to ASCII:

 >>> a=u"aaaàçççñññ"
>>> type(a)
<type 'unicode'>
>>> a.encode('ascii','ignore')
'aaa'
>>> a.encode('ascii','replace')
'aaa???????'
>>>

原文由 Ferran 发布,翻译遵循 CC BY-SA 3.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题