我有一个数据框 df
我使用其中的几列到 groupby
:
df['col1','col2','col3','col4'].groupby(['col1','col2']).mean()
通过上述方式,我几乎得到了我需要的表格(数据框)。缺少的是一个附加列,其中包含每个组中的行数。换句话说,我有意思,但我也想知道有多少数字被用来获得这些意思。例如,第一组有 8 个值,第二组有 10 个值,依此类推。
简而言之:如何获取数据框的 分组 统计信息?
原文由 Roman 发布,翻译遵循 CC BY-SA 4.0 许可协议
在
groupby
对象上,agg
函数可以使用一个列表同时 应用多种聚合方法。这应该会给你你需要的结果: