错误:PerfectSeparationError:检测到完美分离,结果不可用

新手上路,请多包涵

这是火车数据集的头部。

X_Train 的负责人

运行以下代码:

 logit = sm.GLM(Y_train, X_train, family=sm.families.Binomial())
result = logit.fit()

你能帮忙吗?

出现以下错误: 错误屏幕截图

原文由 Dipannita Banerjee 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 1.1k
1 个回答

Python 在一个或多个预测变量和结果变量中检测到完全或准完全分离。

当一个预测变量类别(或预测变量组合)中的所有或几乎所有值仅与一个二元结果值相关联时,就会发生这种情况。 (我假设您正在尝试逻辑回归。)发生这种情况时,无法找到预测系数的解决方案。

有几种可能的解决方案。根据您的分析中有多少变量,您可以尝试对结果和每个预测变量运行双向交叉表以找到具有零观测值的任何单元格,然后从分析中删除该变量或使用更少的类别。另一种选择是运行 Firth 逻辑回归或惩罚回归。

原文由 RobertF 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题
logo
Stack Overflow 翻译
子站问答
访问
宣传栏