在我的一个目录中,我有多个 CSV 文件。我想通过 python 代码读取所有 CSV 文件的内容并打印数据,但直到现在我还不能这样做。
所有 CSV 文件都具有相同的列数和相同的列名。
我知道一种列出目录中所有 CSV 文件并通过“os”模块和“for”循环遍历它们的方法。
for files in os.listdir("C:\\Users\\AmiteshSahay\\Desktop\\test_csv"):
现在使用“csv”模块读取文件名
reader = csv.reader(files)
到这里为止,我希望输出是 CSV 文件的名称。这恰好被排序。例如,名称为 1.csv、2.csv 等。但输出如下
<_csv.reader object at 0x0000019F97E0E730>
<_csv.reader object at 0x0000019F97E0E528>
<_csv.reader object at 0x0000019F97E0E730>
<_csv.reader object at 0x0000019F97E0E528>
<_csv.reader object at 0x0000019F97E0E730>
<_csv.reader object at 0x0000019F97E0E528>
如果我在 csv.reader() 之后添加 next() 函数,我得到以下输出
['1']
['2']
['3']
['4']
['5']
['6']
这恰好是我的 CSV 文件名的首字母。这是部分正确但不完全正确。
除此之外,一旦我迭代了文件,如何在屏幕上查看 CSV 文件的内容?今天我有 6 个文件。后来,我可以有 100 个文件。因此,在我的场景中不可能使用文件处理方法。
有什么建议么?
原文由 skill_seeker 发布,翻译遵循 CC BY-SA 4.0 许可协议
我建议使用 pandas 库阅读您的 CSV。在这里检查这个答案: Import multiple csv files into pandas and concatenate into one DataFrame
虽然你一般要求使用 python,但 pandas 在数据 I/O 方面做得很好,我认为它会在这里帮助你。