Kmeans如何应用于减轻类别不平衡的数据上,然后用来训练其他模型?
用kmeans做工具,不是用不平衡数据区训练kmeans!
举例:
训练数据中A,B,C,D,其中A B类别很多 CD很少;
预测数据中全部是A,C。
此时用kmeans直接把ABCD 聚类成2个?
查看过一些博客,基本上都是水文,没多少有用价值。。。
Kmeans如何应用于减轻类别不平衡的数据上,然后用来训练其他模型?
用kmeans做工具,不是用不平衡数据区训练kmeans!
举例:
训练数据中A,B,C,D,其中A B类别很多 CD很少;
预测数据中全部是A,C。
此时用kmeans直接把ABCD 聚类成2个?
查看过一些博客,基本上都是水文,没多少有用价值。。。
3 回答3.4k 阅读✓ 已解决
1 回答3k 阅读✓ 已解决
1 回答4.4k 阅读
1 回答3.1k 阅读
1 回答2.7k 阅读
2 回答1.3k 阅读
2.7k 阅读
是的,是直接改变训练数据数据分布的。
只保留majority类别,其中还有imbalanced-learn这个库帮助可以实现。里面还有其他各种治疗方法,也可以参考。
具体可以看这篇:https://zhuanlan.zhihu.com/p/640220466