我想知道如何从单个文件夹中读取多个 json
文件(不指定文件名,只是它们是 json 文件)。
另外,可以将它们变成 pandas
DataFrame 吗?
你能给我一个基本的例子吗?
原文由 donpresente 发布,翻译遵循 CC BY-SA 4.0 许可协议
我想知道如何从单个文件夹中读取多个 json
文件(不指定文件名,只是它们是 json 文件)。
另外,可以将它们变成 pandas
DataFrame 吗?
你能给我一个基本的例子吗?
原文由 donpresente 发布,翻译遵循 CC BY-SA 4.0 许可协议
使用 glob
模块可以轻松迭代(平面)目录
from glob import glob
for f_name in glob('foo/*.json'):
...
至于直接将JSON读入 pandas
,看 这里。
原文由 Ami Tavory 发布,翻译遵循 CC BY-SA 3.0 许可协议
1 回答9.6k 阅读✓ 已解决
2 回答5.3k 阅读✓ 已解决
2 回答3.6k 阅读✓ 已解决
1 回答5.4k 阅读✓ 已解决
1 回答6.3k 阅读✓ 已解决
3 回答4.5k 阅读
3 回答1.4k 阅读✓ 已解决
一种选择是使用 os.listdir 列出目录中的所有文件,然后仅查找以“.json”结尾的文件:
现在您可以使用 pandas DataFrame.from_dict 将 json(此时是 python 字典)读入 pandas 数据框:
印刷:
在这种情况下,我将一些 json 附加到列表
many_jsons
。我列表中的第一个 json 实际上是一个 geojson ,其中包含蒙特利尔的一些地理数据。我已经熟悉内容,所以我打印出“几何”,它给出了蒙特利尔的经度/纬度。以下代码总结了上面的所有内容:
对我来说这打印:
知道对于此代码我在目录名称“json”中有两个 geojson 可能会有所帮助。每个 json 具有以下结构: