对于缺失值基本有删除、填充和重构变量等做法,但是具体的操作是怎么进行的呢?比方说你当你并不清楚各个字段的含义时:
1.如何认定该字段与模型无关、缺失值的比例达到多少就可以删除?
2.什么时候会认为缺失值也是一种有用的状态?
3.什么时候需要进行数据填充?
对于缺失值基本有删除、填充和重构变量等做法,但是具体的操作是怎么进行的呢?比方说你当你并不清楚各个字段的含义时:
1.如何认定该字段与模型无关、缺失值的比例达到多少就可以删除?
2.什么时候会认为缺失值也是一种有用的状态?
3.什么时候需要进行数据填充?
4 回答4.4k 阅读✓ 已解决
4 回答3.8k 阅读✓ 已解决
3 回答2.1k 阅读✓ 已解决
1 回答4.4k 阅读✓ 已解决
1 回答3.8k 阅读✓ 已解决
1 回答2.8k 阅读✓ 已解决
2 回答2k 阅读✓ 已解决
方法还是挺多的。
我找到几个链接,附在下面,应该对你有帮助。
训练集中有的特征含有缺失值,一般怎么处理
如何判断缺失值是否是随机的缺失?