Kmeans如何应用于减轻类别不平衡的数据上,然后用来训练其他模型?
用kmeans做工具,不是用不平衡数据区训练kmeans!
举例:
训练数据中A,B,C,D,其中A B类别很多 CD很少;
预测数据中全部是A,C。
此时用kmeans直接把ABCD 聚类成2个?
查看过一些博客,基本上都是水文,没多少有用价值。。。
Kmeans如何应用于减轻类别不平衡的数据上,然后用来训练其他模型?
用kmeans做工具,不是用不平衡数据区训练kmeans!
举例:
训练数据中A,B,C,D,其中A B类别很多 CD很少;
预测数据中全部是A,C。
此时用kmeans直接把ABCD 聚类成2个?
查看过一些博客,基本上都是水文,没多少有用价值。。。
2 回答4.9k 阅读✓ 已解决
4 回答641 阅读✓ 已解决
1 回答921 阅读✓ 已解决
1 回答719 阅读✓ 已解决
2 回答1.4k 阅读
1 回答737 阅读✓ 已解决
1 回答1k 阅读
是的,是直接改变训练数据数据分布的。
只保留majority类别,其中还有imbalanced-learn这个库帮助可以实现。里面还有其他各种治疗方法,也可以参考。
具体可以看这篇:https://zhuanlan.zhihu.com/p/640220466