Python Pandas：如何确定数据集的分布？

Question

新手上路，请多包涵

这是我的数据集，包含两列 NS 和计数。

     NS                                                count
0   ns18.dnsdhs.com.                                  1494
1   ns0.relaix.net.                                   1835
2   ns2.techlineindia.com.                            383
3   ns2.microwebsys.com.                              1263
4   ns2.holy-grail-body-transformation-program.com.   1
5   ns2.chavano.com.                                  1
6   ns1.x10host.ml.                                   17
7   ns1.amwebaz.info.                                 48
8   ns2.guacirachocolates.com.br.                     1
9   ns1.clicktodollars.com.                           2

现在我想通过绘制它来查看有多少 NS 具有相同的计数。我自己的猜测是我可以使用直方图来查看，但我不确定如何。谁能帮忙？

原文由 UserYmY 发布，翻译遵循 CC BY-SA 4.0 许可协议

python pandas plot histogram

阅读 341

1 个回答

得票最新

社区维基

1

发布于
2023-01-09

根据您的评论，我猜您的数据表实际上要长得多，并且您想查看名称服务器 counts 的分布（无论此处为多少）。

我认为你应该能够做到这一点：

 df.hist(column="count")

你会得到你想要的。如果那是你想要的。

pandas 的所有功能都有不错的文档，直方图在此处进行了描述。

如果你真的想看到“有多少人有相同的计数”，而不是分布的表示，那么你要么需要将 bins kwarg 设置为 df["count"].max()-df["count"].min() -或者按照你说的做，计算你得到每个的次数 count 然后创建一个条形图。

也许是这样的：

 from collections import Counter
counts = Counter()
for count in df["count"]:
  counts[count] += 1

print counts

我完全错过并在下面指出的第二次世界大战的另一种更简洁的方法只是使用 Counter 的标准构造函数：

 count_counter = Counter(df['count'])

原文由 will 发布，翻译遵循 CC BY-SA 3.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

Stack Overflow 翻译

子站问答

访问

本篇内容翻译自 Stack Overflow，如果你觉得翻译结果值得改进，欢迎直接编辑修改，感谢你为社区贡献。

相似问题

找不到问题？创建新问题

Python Pandas：如何确定数据集的分布？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Stack Overflow 翻译

Python Pandas：如何确定数据集的分布？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。 请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Stack Overflow 翻译

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？