python中文字符转义问题

libraco
  • 760
print '中国'              #输出:中国
print ['中国']            #输出:['\xd6\xd0\xb9\xfa']
print {'中国':'中国'}      #输出: {'\xd6\xd0\xb9\xfa': '\xd6\xd0\xb9\xfa'}

请问一下为什么在list和dict打印出来是转义字符?

回复
阅读 8.5k
2 个回答
✓ 已被采纳

这是 Python 2 特别讨厌的一点,以至于我实在忍受不了写了个 repl_py27 来绕过该问题。不过最终还是迁移到 Python 3 啦 =w=

Python 2 的世界是个 ASCII 的世界,unicode 是后来加的,所以使用 repr 显示的时候是把所有非 ASCII 的字符转义显示的。你要直接把字符串写出来的话,Python 2 就不会进行任何转义了,于是在支持的终端上,中文就能正常显示了。

注意 @socrates 说的是错的。print 遇到非字符串时,会调用 str() 函数将对象转成字符串再输出:

>>> class T(object):
...   def __repr__(self):
...     return '<repr>'
...   def __str__(self):
...     return '<str>'
... 
>>> print T()
<str>

而很多对象的 __str__ 方法是没有定义的,于是 str() 函数改调用它的 __repr__ 方法。

又:Python 2 的字符串和 unicode 的 str() 输出都是经过转义的。这也是我讨厌 Python 2 的另一个重要原因:

>>> u'中文'
u'\u4e2d\u6587'
>>> '中文'                                                   
'\xe4\xb8\xad\xe6\x96\x87'

可以认为一个是用的是str方法,目的是向终端显示;一个用的repr方法,目的是把数据结构和类型表达出来

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
你知道吗?

宣传栏