在写python爬虫的时候(python3),在网页中获取的字符串是utf-8编码的:
请问如何将这些utf-8编码转换为看得懂的字符串?
我有想过用decode函数,但只有bytes类型才能调用decode函数,我这里的一串编码实际上还是string类型的。
比如:
#这种是没有问题的
mystery = b"\xe5\x88\xab"
x = mystery.decode('utf-8')
#这种则会报错
mystery = "\xe5\x88\xab"
x = mystery.decode('utf-8')
爬虫从网页里拿到的应该是r"xe5x88xab"?