python3中如何将utf-8的编码转化为正常的字符串

在写python爬虫的时候(python3)，在网页中获取的字符串是utf-8编码的：

请问如何将这些utf-8编码转换为看得懂的字符串？

我有想过用decode函数，但只有bytes类型才能调用decode函数，我这里的一串编码实际上还是string类型的。

比如：

#这种是没有问题的
mystery = b"\xe5\x88\xab"
x = mystery.decode('utf-8')

#这种则会报错
mystery = "\xe5\x88\xab"
x = mystery.decode('utf-8')

阅读 5.1k

2 个回答

得票最新

爬虫从网页里拿到的应该是r"xe5x88xab"？

>>> mystery = r"\xe5\x88\xab"
>>> x = bytearray.fromhex(''.join(mystery.split("\\x"))).decode()
>>> print(x)
别

别怪我啰嗦，深深的刺痛你。

data = b'你所拿到的全部数据'

也就是说，把你的全部数据都纳入 b'' 中。如果涉及到换行问题，请自行用 Python 来处理即可。

撰写回答

推荐问题

相似问题

找不到问题？创建新问题