新手上路，请多包涵

   Survived  SibSp  Parch
0         0      1      0
1         1      1      0
2         1      0      0
3         1      1      0
4         0      0      1

鉴于上述数据框，是否有一种优雅的方式来 groupby 有条件？我想根据以下条件将数据分成两组：

 (df['SibSp'] > 0) | (df['Parch'] > 0) =   New Group -"Has Family"
 (df['SibSp'] == 0) & (df['Parch'] == 0) = New Group - "No Family"

然后采用这两个组的方法并最终得到如下输出：

                SurvivedMean
 Has Family    Mean
 No Family     Mean

可以使用 groupby 完成还是我必须使用上述条件语句附加一个新列？

原文由 George Vince 发布，翻译遵循 CC BY-SA 4.0 许可协议

python pandas dataframe conditional-statements pandas-groupby

阅读 537

2 个回答

得票最新

社区维基

发布于
2023-01-08

✓ 已被采纳

一种简单的分组方法是使用这两列的总和。如果其中任何一个为正，则结果将大于 1。只要长度与 DataFrame 的长度相同，groupby 就可以接受任意数组，因此您无需添加新列。

 family = np.where((df['SibSp'] + df['Parch']) >= 1 , 'Has Family', 'No Family')
df.groupby(family)['Survived'].mean()
Out:
Has Family    0.5
No Family     1.0
Name: Survived, dtype: float64

原文由 ayhan 发布，翻译遵循 CC BY-SA 3.0 许可协议

社区维基

发布于
2023-01-08

如果列 SibSp 和 Parch 中的值永远小于 0 ，则仅使用一个条件：

 m1 = (df['SibSp'] > 0) | (df['Parch'] > 0)

df = df.groupby(np.where(m1, 'Has Family', 'No Family'))['Survived'].mean()
print (df)
Has Family    0.5
No Family     1.0
Name: Survived, dtype: float64

如果不可能使用首先使用两个条件：

 m1 = (df['SibSp'] > 0) | (df['Parch'] > 0)
m2 = (df['SibSp'] == 0) & (df['Parch'] == 0)
a = np.where(m1, 'Has Family',
    np.where(m2, 'No Family', 'Not'))

df = df.groupby(a)['Survived'].mean()
print (df)
Has Family    0.5
No Family     1.0
Name: Survived, dtype: float64

原文由 jezrael 发布，翻译遵循 CC BY-SA 3.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

Stack Overflow 翻译

子站问答

访问

本篇内容翻译自 Stack Overflow，如果你觉得翻译结果值得改进，欢迎直接编辑修改，感谢你为社区贡献。

相似问题

找不到问题？创建新问题

Pandas - Groupby 条件公式

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？

Stack Overflow 翻译