使用`zipfile`模块在不解压缩的情况下如何使用text模式读取文本文件?

MrChi
  • 489

我使用的Python版本为3.5.2,尝试用zipfile模块的zipfile.ZipFile.open方法打开一个压缩包中的文本文件时,即使使用了文档中要求的rU参数,打开时仍然是以二进制数据格式打开的,百思不得其解。

代码:

>>> import zipfile
>>> zf = zipfile.ZipFile('/Users/chiqingjun/Downloads/top-1m.csv.zip')
>>> zf.namelist()
['top-1m.csv']
>>> f = zf.open(zf.namelist()[0], mode='rU')
>>> f
<zipfile.ZipExtFile name='top-1m.csv' mode='rU' compress_type=deflate>
>>> f.readline()
b'1,google.com\n'
# 仍然是二进制数据

官方文档(3.5.2版本):
图片描述

回复
阅读 6k
2 个回答

文档已经说了呀,rU通用换行符,并且将在3.6 移除此模式。

压缩文件以二进制读取字节内容是应该的,后面如何转码由程序员决定。

其实最后输出的二进制, 和zipfile无关, 是和py3.5有关, 你可以在输出的结果解码, 就能得到字符类型了

content = f.readline()
print(content.decode('utf8'))
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
宣传栏