我需要在每个 domain
中计算唯一的 ID
值。
我有数据:
ID, domain
123, 'vk.com'
123, 'vk.com'
123, 'twitter.com'
456, 'vk.com'
456, 'facebook.com'
456, 'vk.com'
456, 'google.com'
789, 'twitter.com'
789, 'vk.com'
我试试 df.groupby(['domain', 'ID']).count()
但我想得到
domain, count
vk.com 3
twitter.com 2
facebook.com 1
google.com 1
原文由 Arseniy Krupenin 发布,翻译遵循 CC BY-SA 4.0 许可协议
你需要
nunique
:如果需要
strip
'
字符:或者正如 Jon Clements 评论的那样:
您可以像这样保留列名:
区别在于
nunique()
返回一个系列,而agg()
返回一个数据帧。