这个主要是因为zip文件对文件名的编码默认为当前环境的locale,如在windows下压缩的zip文件,在linux下其中的中文名便会乱码。

这是zip格式的缺陷,所以目前并没有很完美的解决办法。当前的办法有如下两种:

使用upzip命令的时候加个参数

upzip -O CP936 a.zip

用python写一个脚本来解压

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# unzip-gbk.py

import os
import sys
import zipfile

print "Processing File " + sys.argv[1]

file=zipfile.ZipFile(sys.argv[1],"r");
for name in file.namelist():
    utf8name=name.decode('gbk')
    print "Extracting " + utf8name
    pathname = os.path.dirname(utf8name)
    if not os.path.exists(pathname) and pathname!= "":
        os.makedirs(pathname)
    data = file.read(name)
    if not os.path.exists(utf8name):
        fo = open(utf8name, "w")
        fo.write(data)
        fo.close
file.close()

warning: 该程序没有经过我的验证,请自己试验以保证正确性

参考

http://note.ninehills.info/linux-gbk.html


wangdai
1k 声望18 粉丝