pandas
drop_duplicates
函数非常适合“统一化”数据框。但是,要传递的关键字参数之一是 take_last=True
或 take_last=False
,而我想删除所有列子集中重复的行。这可能吗?
A B C
0 foo 0 A
1 foo 1 A
2 foo 1 B
3 bar 1 A
例如,我想删除匹配列 A
和 C
的行,因此这应该删除第 0 行和第 1 行。
原文由 Jamie Bull 发布,翻译遵循 CC BY-SA 4.0 许可协议
现在使用 drop_duplicates 和 keep 参数,这在 pandas 中要容易得多。