Python:将熊猫数据框保存到镶木地板文件

新手上路,请多包涵

是否可以将熊猫数据框直接保存到镶木地板文件中?如果没有,建议的流程是什么?

目的是能够将 parquet 文件发送给另一个团队,他们可以使用 scala 代码读取/打开它。谢谢!

原文由 Edamame 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 335
1 个回答

熊猫有一个核心功能 to_parquet() 。只需将数据框写入镶木地板格式,如下所示:

 df.to_parquet('myfile.parquet')

您仍然需要安装镶木地板库,例如 fastparquet 。如果您安装了多个 parquet 库,您还需要指定您希望 pandas 使用哪个引擎,否则将安装第一个(如 文档 中所示)。例如:

 df.to_parquet('myfile.parquet', engine='fastparquet')

原文由 ben26941 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进