最近在用Python处理公交GPS轨迹数据,但是遇到一些编码问题,很是烦人。原始数据是.gz格式的数据,我在windows上解码后,我把它转成.txt格式的文件,但是文件中包含大量的乱码,不管怎么去转化编码都没有起作用的,如下图:
这是.gz文件和解压后文件:
这是转换成txt后的文件:
然后打开txt文件后就成了下面的各种乱码,我尝试用utf-8,gbk,gb2312转换编码也没有任何效果的,具体如下图所示。
所以就想问一下大家:
①有什么编码可以将.gz格式的文件中的中文乱码纠正
②我现在是一行行对数据进行处理,请问有什么方法可以识别该字符串包含乱码?
还有一种叫base64码,试试看