本来是
%C3%A5%C2%88%C2%86%C3%A5%C2%A4%C2%A7%C3%A8%C2%83%C2%9C%C3%A5%C2%88%C2%86%C3%A6%C2%B4%C2%92
decode 转完就是
å大èåæ´
本来是
%C3%A5%C2%88%C2%86%C3%A5%C2%A4%C2%A7%C3%A8%C2%83%C2%9C%C3%A5%C2%88%C2%86%C3%A6%C2%B4%C2%92
decode 转完就是
å大èåæ´
不知道原来的编码是什么。但是我是用utf-8解码,得到了‘分大胜分洒’,这个诡异的字符串
我是用的方法是先用urllib2.unquote(),解码,然后使用utf-8解码
如下>>>a='%.....................%'#你的
>>>b=urllib2.unquote(a)
>>>c=''.join([chr(ord(i)) for i in b.decode('utf-8')])
>>>print c
这里有一个相关的讨论,见http://www.douban.com/group/topic/349...
这个跟url encode时的字符编码和你url decode时的字符编码有关。
举个例子,如果是一个不在gb2312字符范围内的字符串,你用gb2312字符集encode,然后decode的时候,不管你是用gb2312字符集还是utf-8字符集都无法恢复。