提取 kmeans 集群中节点和质心之间距离的任何选项。
我已经对文本嵌入数据集进行了 Kmeans 聚类,我想知道在每个聚类中哪些节点远离质心,以便我可以检查各个节点的功能是否有所不同。
提前致谢!
原文由 Arav 发布,翻译遵循 CC BY-SA 4.0 许可协议
提取 kmeans 集群中节点和质心之间距离的任何选项。
我已经对文本嵌入数据集进行了 Kmeans 聚类,我想知道在每个聚类中哪些节点远离质心,以便我可以检查各个节点的功能是否有所不同。
提前致谢!
原文由 Arav 发布,翻译遵循 CC BY-SA 4.0 许可协议
KMeans.transform()
返回每个样本到聚类中心的距离数组。transform
X 并取每行的总和 (axis=1
) 以识别离中心最远的样本。视觉检查——相同的图,只是这次突出显示了距每个聚类中心最远的点: