新手上路，请多包涵

我有一个包含 A、B 和 C 列的 DataFrame。对于 A 的每个值，我想选择 B 列中具有最小值的行。

也就是说，从这个：

 df = pd.DataFrame({'A': [1, 1, 1, 2, 2, 2],
                   'B': [4, 5, 2, 7, 4, 6],
                   'C': [3, 4, 10, 2, 4, 6]})
    A   B   C
0   1   4   3
1   1   5   4
2   1   2   10
3   2   7   2
4   2   4   4
5   2   6   6

我想得到：

     A   B   C
0   1   2   10
1   2   4   4

目前，我按 A 列分组，然后创建一个值，向我指示我将保留的行：

 a = data.groupby('A').min()
a['A'] = a.index
to_keep = [str(x[0]) + str(x[1]) for x in a[['A', 'B']].values]
data['id'] = data['A'].astype(str) + data['B'].astype('str')
data[data['id'].isin(to_keep)]

我相信有一种更直接的方法可以做到这一点。我在这里看到许多使用 MultiIndex 的答案，我宁愿避免使用它。

谢谢您的帮助。

原文由 Wendy 发布，翻译遵循 CC BY-SA 4.0 许可协议

python pandas group-by

阅读 802

2 个回答

得票最新

社区维基

发布于
2023-01-08

✓ 已被采纳

我觉得你想多了。只需使用 groupby 和 idxmin ：

 df.loc[df.groupby('A').B.idxmin()]

   A  B   C
2  1  2  10
4  2  4   4

 df.loc[df.groupby('A').B.idxmin()].reset_index(drop=True)

   A  B   C
0  1  2  10
1  2  4   4

原文由 cs95 发布，翻译遵循 CC BY-SA 4.0 许可协议

社区维基

发布于
2023-01-08

有类似的情况，但列标题更复杂 （例如“B val”） ，在这种情况下需要这样做：

 df.loc[df.groupby('A')['B val'].idxmin()]

原文由 Juho 发布，翻译遵循 CC BY-SA 4.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

Stack Overflow 翻译

子站问答

访问

本篇内容翻译自 Stack Overflow，如果你觉得翻译结果值得改进，欢迎直接编辑修改，感谢你为社区贡献。

相似问题

找不到问题？创建新问题

Pandas GroupBy 并选择特定列中具有最小值的行

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？

Stack Overflow 翻译