python3中如何将utf-8的编码转化为正常的字符串

在写python爬虫的时候(python3),在网页中获取的字符串是utf-8编码的:
clipboard.png
请问如何将这些utf-8编码转换为看得懂的字符串?

我有想过用decode函数,但只有bytes类型才能调用decode函数,我这里的一串编码实际上还是string类型的。

比如:

#这种是没有问题的
mystery = b"\xe5\x88\xab"
x = mystery.decode('utf-8')
#这种则会报错
mystery = "\xe5\x88\xab"
x = mystery.decode('utf-8')
阅读 5k
2 个回答

爬虫从网页里拿到的应该是r"xe5x88xab"?

>>> mystery = r"\xe5\x88\xab"
>>> x = bytearray.fromhex(''.join(mystery.split("\\x"))).decode()
>>> print(x)
别

别怪我啰嗦,深深的刺痛你。

data = b'你所拿到的全部数据'

也就是说,把你的全部数据都纳入 b'' 中。如果涉及到换行问题,请自行用 Python 来处理即可。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题