请问python列表推导式中的同名变量为啥可以判断不同？

发布于
2021-07-16

更新于
2021-07-16

在一份学习资料中看到如下代码:

def MissingPercent(df,x):
    missing_values = df[x].map(lambda x: int(x!=x))
    return sum(missing_values)*1.0/df.shape[0]
Rate = MissingPercent(Data,col)
Rate

其中Data是一个DataFrame，有点奇怪x!=x中的两个x分别指什么呢？
代码本身是运行成功可得到具体的比例的。
补充：该函数的功能是返回数据框Data中col列的缺失值比例
列中的值应该是类别而非数值型

python3.x pandas

阅读 1.8k

2 个回答

bingo彬哥

我的回答有误,理解错了,看题主的解答.

yanyu

1815

发布于
2021-07-16

明白了，因为在python中nan不等于nan
即：

import numpy as np
np.nan == np.nan

# False

所以被作者用来做缺失值的检测
感谢楼上热心坛友的解答！

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

为什么pandas iloc()中使用df.iloc[[i][0]]会导致特定行为？
pandas中iloc()函数的参数问题我刚刚开始学习pandas，在一份代码中出现了df.iloc[[1][0]]（df是shape为(60935, 54)的pd.DataFrame数据类型）的调用，从代码上下文上理解df.iloc[[1][0]]应该是df的一行，但是应该如何理解[[1][0]]呢？为什么iloc[]中的参数会允许接受两个相邻的列表？iloc[]内部是如何处理的？这显然不是...
947 阅读

相似问题

找不到问题？创建新问题

请问python列表推导式中的同名变量为啥可以判断不同？

你尚未登录，登录后可以

为什么pandas iloc()中使用df.iloc[[i][0]]会导致特定行为？