我有一个由 22 个分类变量(无序)组成的数据集。我想在一个漂亮的 热图 中可视化它们的相关性。由于 Pandas 内置函数
DataFrame.corr(method='pearson', min_periods=1)
只实现数值变量(Pearson、Kendall、Spearman)的相关系数,我必须自己聚合它以执行卡方或类似的东西,我不太确定在 一个优雅的步骤 中使用哪个函数来完成它(而不是遍历所有 cat1*cat2 对)。需要明确的是,这就是我想要结束的(一个 数据框):
cat1 cat2 cat3
cat1| coef coef coef
cat2| coef coef coef
cat3| coef coef coef
pd.pivot_table 的任何想法或相同的东西?
先谢谢了。
原文由 zar3bski 发布,翻译遵循 CC BY-SA 4.0 许可协议
您可以使用
pd.factorize
数据输入
更新