新手上路，请多包涵

我正在尝试学习熊猫，但我对以下内容感到困惑。我想用行平均值替换 DataFrame 中的 NaN。因此，像 df.fillna(df.mean(axis=1)) 这样的东西应该可以工作，但由于某种原因它对我来说失败了。我错过了什么，我在做什么有问题吗？是因为没有实施吗？在这里查看链接

import pandas as pd
import numpy as np

pd.__version__
Out[44]:
'0.15.2'

In [45]:
df = pd.DataFrame()
df['c1'] = [1, 2, 3]
df['c2'] = [4, 5, 6]
df['c3'] = [7, np.nan, 9]
df

Out[45]:
    c1  c2  c3
0   1   4   7
1   2   5   NaN
2   3   6   9

In [46]:
df.fillna(df.mean(axis=1))

Out[46]:
    c1  c2  c3
0   1   4   7
1   2   5   NaN
2   3   6   9

然而这样的事情看起来工作正常

df.fillna(df.mean(axis=0))

Out[47]:
    c1  c2  c3
0   1   4   7
1   2   5   8
2   3   6   9

原文由 Aenaon 发布，翻译遵循 CC BY-SA 4.0 许可协议

python pandas dataframe missing-data

阅读 748

2 个回答

得票最新

社区维基

发布于
2023-01-10

✓ 已被采纳

正如评论的那样， fillna 的轴参数是 NotImplemented 。

 df.fillna(df.mean(axis=1), axis=1)

注意：这在这里很重要，因为您不想用第 n 行平均值填充第 n 列。

现在你需要遍历：

 m = df.mean(axis=1)
for i, col in enumerate(df):
    # using i allows for duplicate columns
    # inplace *may* not always work here, so IMO the next line is preferred
    # df.iloc[:, i].fillna(m, inplace=True)
    df.iloc[:, i] = df.iloc[:, i].fillna(m)

print(df)

   c1  c2   c3
0   1   4  7.0
1   2   5  3.5
2   3   6  9.0

另一种方法是 fillna 转置然后转置，这可能更有效……

 df.T.fillna(df.mean(axis=1)).T

原文由 Andy Hayden 发布，翻译遵循 CC BY-SA 4.0 许可协议

社区维基

发布于
2023-01-10

作为替代方案，您还可以使用 apply 和 lambda 表达式，如下所示：

 df.apply(lambda row: row.fillna(row.mean()), axis=1)

屈服也

    c1   c2   c3
0  1.0  4.0  7.0
1  2.0  5.0  3.5
2  3.0  6.0  9.0

原文由 Cleb 发布，翻译遵循 CC BY-SA 3.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

Stack Overflow 翻译

子站问答

访问

本篇内容翻译自 Stack Overflow，如果你觉得翻译结果值得改进，欢迎直接编辑修改，感谢你为社区贡献。

相似问题

找不到问题？创建新问题

Pandas Dataframe：用行平均值替换 NaN

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Stack Overflow 翻译

Pandas Dataframe：用行平均值替换 NaN

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。 请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Stack Overflow 翻译

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？