基本上和 Select first row in each GROUP BY group一样? 仅在熊猫中。
df = pd.DataFrame({'A' : ['foo', 'foo', 'foo', 'foo', 'bar', 'bar', 'bar', 'bar'],
'B' : ['3', '1', '2', '4','2', '4', '1', '3'],
})
排序看起来很有希望:
df.sort('B')
A B
1 foo 1
6 bar 1
2 foo 2
4 bar 2
0 foo 3
7 bar 3
3 foo 4
5 bar 4
但是首先不会给出想要的结果…… df.groupby(‘A’).first()
B
A
bar 2
foo 3
原文由 ihadanny 发布,翻译遵循 CC BY-SA 4.0 许可协议
通常,如果您希望您的数据按 groupby 排序,但它不是要分组的列之一,那么最好在执行
sort
之前执行 dfgroupby
: