熊猫中两个数据框之间的差异

新手上路,请多包涵

我有两个数据框,它们都具有相同的基本模式。 (4 个日期字段、几个字符串字段和 4-5 个浮点字段)。称他们为 df1df2

我想要做的基本上是获得两者的“差异”——我在其中返回所有未在两个数据帧之间共享的行(不在集合交集中)。请注意,两个数据帧的长度不必相同。

我尝试使用 pandas.merge(how='outer') 但我不确定要将哪一列作为“键”传递,因为确实没有,而且我尝试的各种组合都不起作用。 df1df2 可能有两行(或更多行)相同。

在 pandas/Python 中执行此操作的好方法是什么?

原文由 mhy 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 350
1 个回答

尝试这个:

 diff_df = pd.merge(df1, df2, how='outer', indicator='Exist')

diff_df = diff_df.loc[diff_df['Exist'] != 'both']

您将拥有 df1 和 df2 上都不存在的所有行的数据框。

原文由 niceGuy 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题