0

打个比方,我有两个表。第一个表中有5行 第二个表中也有五行。
两个表的列名都一样。结构完全一样。
第二个表中有三行和第一个表中的三行是重复的
现在有什么快捷方法可以把第二个表中那重复的三行删了。结果只要两行
最好不要来个对每个值每个表遍历搜索一次。因为真实数据框比较大那样执行就太麻烦了。

2019-01-18 提问
2 个回答
0

将两表转换成两个 DataFrame,
再用 pandas.concat() 合并,
最后用 DataFrame.drop_duplicates() 删除重复的记录.

0

df2 = df2.merge(df1, how="left", indicator=True).query("_merge == 'left_only'").drop("_merge", axis=1)
如果需要刷新表2的index那就在上面的语句最后再加上.reset_index(drop=True)

撰写答案

推广链接