Kmeans如何应用于类别不平衡的数据上(用kmeans做工具)?

Kmeans如何应用于减轻类别不平衡的数据上,然后用来训练其他模型?
用kmeans做工具,不是用不平衡数据区训练kmeans!

举例:
训练数据中A,B,C,D,其中A B类别很多 CD很少;
预测数据中全部是A,C。

此时用kmeans直接把ABCD 聚类成2个?

查看过一些博客,基本上都是水文,没多少有用价值。。。

阅读 765
1 个回答

是的,是直接改变训练数据数据分布的。
只保留majority类别,其中还有imbalanced-learn这个库帮助可以实现。里面还有其他各种治疗方法,也可以参考。

具体可以看这篇:https://zhuanlan.zhihu.com/p/640220466

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题