如何找出列中唯一值的数量以及数据框中唯一值的数量?

新手上路,请多包涵

根据以下数据集,我不想获取唯一值的数量和唯一值的数量。

我的数据集:

 Account_Type
Gold
Gold
Platinum
Gold

输出 :

 no of unique values : 2
unique values : [Gold,Platinum]
Gold : 3
Platinum :1

原文由 Sidhartha 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 403
2 个回答

使用 pd.value_counts

 pd.value_counts(df.Account_Type)

Gold        3
Platinum    1
Name: Account_Type, dtype: int64

也获得独特的数量

s = pd.value_counts(df.Account_Type)
s1 = pd.Series({'nunique': len(s), 'unique values': s.index.tolist()})
s.append(s1)

Gold                            3
Platinum                        1
nunique                         2
unique values    [Gold, Platinum]
dtype: object


替代方法

df['col1'].value_counts(sort=True)
df['col1'].value_counts(sort=True, normalize=True) -> provides proportion

原文由 piRSquared 发布,翻译遵循 CC BY-SA 4.0 许可协议

您可以使用 set() 删除重复项,然后计算长度:

len(set(data_set))

要计算出现次数:

data_set.count(value)

原文由 adabsurdum 发布,翻译遵循 CC BY-SA 3.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题