给定一个看起来像这样的数据框
GROUP VALUE
1 5
2 2
1 10
2 20
1 7
我想计算每组中最大值和最小值之间的差值。也就是说,结果应该是
GROUP DIFF
1 5
2 18
在 Pandas 中执行此操作的简单方法是什么?
对于具有大约 200 万行和 100 万组的数据框,在 Pandas 中执行此操作的快速方法是什么?
原文由 David 发布,翻译遵循 CC BY-SA 4.0 许可协议
使用@unutbu 的
df
每个时间
unutbu 的解决方案最适合大型数据集
np.ptp
文档 返回数组的范围定时
小
df
大
df
df = pd.DataFrame(dict(GROUP=np.arange(1000000) % 100, VALUE=np.random.rand(1000000)))
大
df
许多团体
df = pd.DataFrame(dict(GROUP=np.arange(1000000) % 10000, VALUE=np.random.rand(1000000)))