对大面积空值的数据预处理是怎么进行的?

对于缺失值基本有删除、填充和重构变量等做法,但是具体的操作是怎么进行的呢?比方说你当你并不清楚各个字段的含义时:

1.如何认定该字段与模型无关、缺失值的比例达到多少就可以删除?

2.什么时候会认为缺失值也是一种有用的状态?

3.什么时候需要进行数据填充?

阅读 5.3k
2 个回答
新手上路,请多包涵

請問怎麼用。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题