我有多个包含不同类型的 txt 文件的 zip 文件。像下面这样:
zip1
- file1.txt
- file2.txt
- file3.txt
如何在不解压缩的情况下使用 pandas 读取每个文件?
我知道如果每个 zip 有 1 个文件,我可以使用 read_csv 压缩方法,如下所示:
df = pd.read_csv(textfile.zip, compression='zip')
任何关于如何做到这一点的帮助都会很棒。
原文由 johnnyb 发布,翻译遵循 CC BY-SA 4.0 许可协议
You can pass
ZipFile.open()
topandas.read_csv()
to construct apandas.DataFrame
from a csv-file packed into a multi-filezip
.代码:
将所有
.csv
读入字典的示例: