今天我们来讲一下异方差,在异方差以前,我们先讲一下与异方差类似另一个概念:同方差,那同方差又是什么呢?同方差 = 相同 + 方差,顾名思义就是方差相同。那方差又是什么呢?方差是用来反映数据的波动情况的,方差相同,说明数据的波动情况是相同的。讲完了同方差,那什么是异方差,大家应该也就明白了,异方差就是方差不相同。
为什么要讨论异方差呢,是因为我们在回归分析和方差分析中都是假设样本之间是同方差的。在方差分析中,同方差是各组之间的方差相等;在回归分析中,同方差是指对于每一个样本点来说,随机误差的平方和(残差平方和)是一样的。我们在回归部分给大家讲过,残差平方和是回归值与实际值之间距离的平方和,这一部分是除了自变量X影响之外的其他影响因素造成的,所以我们把这一部分误差叫做随机误差,如果不同样本点之间受随机误差的影响是一样的,则随机误差平方和就是一样的,也就是同方差,反之则是异方差。
如下图反映的就是同方差,也就是不同受教育年限群体之间工资波动情况是相同的。
下图反映的就是异方差,也就是不同受教育年限群体之间工资波动是不同的,受教育年限越长,工资波动会越大;受教育年限越短,工资波动会越小。
了解完了什么是异方差以后,我们来看一下如何看不同样本点之间到底是同方差还是异方差呢?这就涉及到异方差的检验了。检验异方差有描述统计方法和专门的统计检验方法,我们这里主要给大家分享一下描述统计方法——看残差图。
残差图是以残差平方和为纵坐标,一般以回归拟合值y作为横坐标,当然也可以以其他自变量x作为横坐标,以下为几种不同类型的残差图:
上面这种类型的残差图:随着横轴的变化,纵轴围绕着一条水平线在波动,说明数据之间是满足同方差性的。
上面这种类型的残差图:随着横轴的增大,纵轴的数值在变小,说明不同样本之间点之间的方差是不一样的,即异方差。
上面这种类型的残差图:横轴和残差之间是二次关系,也是异方差。
关于上面的残差图如何绘制,我们在后面的回归实操部分给大家一起讲解。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。