在一份学习资料中看到如下代码:
def MissingPercent(df,x):
missing_values = df[x].map(lambda x: int(x!=x))
return sum(missing_values)*1.0/df.shape[0]
Rate = MissingPercent(Data,col)
Rate
其中Data是一个DataFrame,有点奇怪x!=x
中的两个x分别指什么呢?
代码本身是运行成功可得到具体的比例的。
补充:该函数的功能是返回数据框Data中col列的缺失值比例
列中的值应该是类别而非数值型
我的回答有误,理解错了,看题主的解答.