求教一个dataframe 分组问题

发布于
2018-04-12

这样的一个表，想用key1分组，取data2大的那个行，做一个表怎么做？
试过df.groupby('key1',as_index=False).max()取的是所有列的最大，这样不行，请教怎么做？
这是原数据：
df = pd.DataFrame({'key1':['a','a','b','b','a'],'key2':['one','two','one','two','one'],'data1':np.random.randn(5),'data2':np.random.randn(5)})
df

python pandas

阅读 2.5k

2 个回答

mr_s

def f(df, col=1):
    return df[df['data2'] == max(df['data2'])]

df1 = df.groupby(['key1']).apply(f)

burning

发布于
2019-07-09

新手上路，请多包涵

l = df.groupby('key1')['data2'].max().tolist()
df = df.query('data2 in @l')

图片描述

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

求教一个dataframe 分组问题

你尚未登录，登录后可以

Qt中布局是否只有5种呢？

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

这段代码为什么不能获取到数据？

请问一下，如何理解reduce函数呢？

如何使用Python+Selenium爬取Goodreads上万条书评而不崩溃？

如何使用 python 代码实现迅雷磁力链接资源的下载？

在PyCharm开发不同python项目，如果每个项目使用自己的venv环境，是不是每次切换项目都需要修改python interpreter？