Python pandas：如何根据多列对唯一值进行分组和计数？

Question

新手上路，请多包涵

我有数据农场 df：

 id name number
1 sam   76
2 sam    8
2 peter  8
4 jack   2

我想按“id”列分组并根据（名称，数字）对计算唯一值的数量？

 id count(name-number)
1    1
2    2
4    1

我试过这个，但它不起作用：

 df.groupby('id')[('number','name')].nunique().reset_index()

原文由 UserYmY 发布，翻译遵循 CC BY-SA 4.0 许可协议

python pandas group-by unique

阅读 1k

1 个回答

得票最新

社区维基

1

发布于
2023-01-10

您可以将两个 groupby 组合起来以获得所需的结果。

 import pandas
df = pandas.DataFrame({"id": [1, 2, 2, 4], "name": ["sam", "sam", "peter", "jack"], "number": [8, 8, 8, 2]})
group = df.groupby(['id','name','number']).size().groupby(level=0).size()

第一个 groupby 将计算完整的原始组合集（从而使您要计算的列唯一）。第二个 groupby 将计算你想要的每个列的唯一出现次数（你可以使用第一个 groupby 将该列放入索引中的事实）。

结果将是一个系列。如果您希望 DataFrame 具有正确的列名（如您在所需结果中所示），您可以使用 aggregate 函数：

 group = df.groupby(['id','name','number']).size().groupby(level=0).agg({'count(name-number':'size'})

原文由 stedes 发布，翻译遵循 CC BY-SA 3.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

Stack Overflow 翻译

子站问答

访问

本篇内容翻译自 Stack Overflow，如果你觉得翻译结果值得改进，欢迎直接编辑修改，感谢你为社区贡献。

相似问题

找不到问题？创建新问题

Python pandas：如何根据多列对唯一值进行分组和计数？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？

Stack Overflow 翻译