我在使用python2来爬虫的时候,获取到中文的编码形式是\x2569\x2514\x255c\x447\x251c\x221a\x2502\x2561\x2567\x2561\x2534\x2568\x31类似这样的,但是就我所知\x在python2里应该是表示utf-8,形式应该是类似\xE5\x85\x84\xE5\xBC\x9F\xE9\x9A\xBE\xE5\xBD\x93 \xE6\x9D\x9C\xE6\xAD\x8C这样的,所以我想知道我第一句的这个是使用的什么编码,感谢大家
我在使用python2来爬虫的时候,获取到中文的编码形式是\x2569\x2514\x255c\x447\x251c\x221a\x2502\x2561\x2567\x2561\x2534\x2568\x31类似这样的,但是就我所知\x在python2里应该是表示utf-8,形式应该是类似\xE5\x85\x84\xE5\xBC\x9F\xE9\x9A\xBE\xE5\xBD\x93 \xE6\x9D\x9C\xE6\xAD\x8C这样的,所以我想知道我第一句的这个是使用的什么编码,感谢大家
2 回答4.2k 阅读✓ 已解决
2 回答808 阅读✓ 已解决
1 回答4.1k 阅读✓ 已解决
2 回答2.1k 阅读✓ 已解决
3 回答785 阅读✓ 已解决
4 回答2.5k 阅读
3 回答818 阅读✓ 已解决
仔细看,或者用pycharm看,或者用python2解释器打印出来就明白了。
\x2569\x2514\x255c\x447\x251c\x221a\x2502\x2561\x2567\x2561\x2534\x2568\x31
%69%14%5cD7%1c"1a%02%61%67%61%34%681
只有前面两个十六进制数字是真的转义字符,后面的的确就是两个普通数字而已。
\x25 就是 %
另外 \x00 这样的并不是utf-8编码或是别的什么特定的编码,单纯只是一种转义字符,\x00-\xff代表0-255的byte。编码需要指定或者猜测。