我使用 pandas df.value_counts() 来查找特定品牌的出现次数。我想将这些价值计数与初始数据框中的各个品牌合并。
df has many columns including one named 'brands'
brands = df.brands.value_counts()
brand1 143
brand2 21
brand3 101
etc.
如何将价值计数与原始数据框合并,以便每个品牌的相应计数都在一个新列中,比如“brand_count”?
是否可以为这些列分配标题; names 函数不适用于系列,我无法将其转换为数据框以可能以这种方式合并数据。但是,value_counts 输出一系列 dtype int64(品牌名称应为字符串类型),这意味着我不能执行以下操作:
df2 = pd.DataFrame({'brands': list(brands_all[0]), "brand_count":
list(brands_all[1])})
(merge with df)
最终,我想获得这个:
col1 col2 col3 brands brand_count ... col150
A 30
C 140
A 30
B 111
原文由 user2476665 发布,翻译遵循 CC BY-SA 4.0 许可协议
那是你要的吗:
PS 第一个重要部分只是数据帧生成。
您感兴趣的部分从
# generate 'brands'
DF 评论开始