用python将中文字符分成一个个字

发布于
2017-10-30

>>> a='魏茨曼和'
>>> [i for i in a]
['\xe9', '\xad', '\x8f', '\xe8', '\x8c', '\xa8', '\xe6', '\x9b', '\xbc', '\xe5', '\x92', '\x8c']
>>> a='魏和和'
>>> [i for i in a]
['\xe9', '\xad', '\x8f', '\xe5', '\x92', '\x8c', '\xe5', '\x92', '\x8c']
>>> a[0]
'\xe9'

python

阅读 17.5k

3 个回答

得票最新

风v月

22863646

发布于
2017-10-31

✓ 已被采纳

python3默认是unicode，所以python3可以直接循环，但是python2不可以

代码

text='魏和河'
text = unicode(text, 'utf-8')
for i in text:
    print i

Feng_Yu

12.7k62139

发布于
2017-10-30

同样的代码，在python3下运行就没有任何问题。python3强制unicode编码，就可以拆分成一个个汉字

起风了

4.1k2922

发布于
2017-10-30

更新于
2017-10-31

python 2的字符串有隐式的str到byte的转换，而如下所示默认的是（3个byte代表一个中文字的utf8），所以你遍历出来是这个结果。
你可以这么写：

# encoding=utf-8
a = u'魏和河'
for i in a:
    print i

查看全部 3 个回答

推荐问题

相似问题

找不到问题？创建新问题

用python将中文字符分成一个个字

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？