Pyspark：如何将 spark 数据帧转换为 json 并将其保存为 json 文件？

Question

新手上路，请多包涵

我正在尝试将我的 pyspark sql 数据帧转换为 json，然后另存为文件。

 df_final = df_final.union(join_df)

df_final 包含这样的值：

我试过这样的事情。但它创建了一个无效的 json。

 df_final.coalesce(1).write.format('json').save(data_output_file+"createjson.json", overwrite=True)

{"Variable":"Col1","Min":"20","Max":"30"}
{"Variable":"Col2","Min":"25,"Max":"40"}

我预期的文件应包含如下数据：

 [
{"Variable":"Col1",
"Min":"20",
"Max":"30"},
{"Variable":"Col2",
"Min":"25,
"Max":"40"}]

原文由 Shankar Panda 发布，翻译遵循 CC BY-SA 4.0 许可协议

python-3.x pyspark apache-spark-sql

阅读 1.7k

1 个回答

得票最新

社区维基

1

发布于
2022-11-16

对于 pyspark 你可以直接将你的dataframe存储到json文件中，不需要将datafram转换成json。

 df_final.coalesce(1).write.format('json').save('/path/file_name.json')

而且你仍然想将你的数据帧转换为 json 然后你可以使用 df_final.toJSON() 。

原文由 Sahil Desai 发布，翻译遵循 CC BY-SA 4.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

Python连接Phoenix数据库进行数据处理和更新的最佳实践？
python如何连接phoenixpython连接phoenix，用spark计算，然后更新数据
1k 阅读

Stack Overflow 翻译

子站问答

访问

本篇内容翻译自 Stack Overflow，如果你觉得翻译结果值得改进，欢迎直接编辑修改，感谢你为社区贡献。

相似问题

找不到问题？创建新问题

Pyspark：如何将 spark 数据帧转换为 json 并将其保存为 json 文件？

你尚未登录，登录后可以

Python连接Phoenix数据库进行数据处理和更新的最佳实践？

Stack Overflow 翻译