客户流失分析：使用逻辑回归来预测有风险的客户

发布于 2018-12-14

主要观点：线性回归常规易懂，独立变量增加 1 点时，因变量增加 b 单位，但预测离散变量需用逻辑回归。文中将在 Excel 中构建简单客户流失模型，用求解器优化以减少交叉熵误差。线性回归有假设变量间线性关系等局限性，而逻辑回归通过 sigmoid 曲线解决，能更好地解释离散现象。示例展示了逻辑回归中 X 变化时 Y 的变化及如何在 Excel 中构建逻辑回归方程，还介绍了逻辑回归中用交叉熵作为误差度量，可通过梯度下降和 Excel 求解器来降低总体误差，且应引入统计显著变量以提升模型性能。

关键信息：

线性回归与逻辑回归的适用场景及区别。
在 Excel 中构建逻辑回归模型的步骤，包括初始化权重、应用 sigmoid 激活等。
交叉熵作为逻辑回归误差度量的特点及与平方误差的比较。
可通过求解器和梯度下降来优化逻辑回归模型。

重要细节：

逻辑回归方程中通过 sigmoid 曲线将独立变量映射到 0 到 1 之间。
Excel 中计算 sigmoid 激活值时的限制及处理方法。
不同成本函数在客户流失变量为 1 时的表现。
可通过引入统计显著变量提升模型性能。

阅读 48