头图

我们前面讲过,T检验是用来比较两个均值之间是否有显著差异的一种检验方法。这一篇给大家介绍一下T检验的种类以及具体的Python实现代码。T检验是比较两个均值差异的,不同种类T检验的差别其实在于均值的计算差异。

1.单样本T检验

单样本T检验是用来检验一组样本的均值A与一个已知的均值B之间是否有差异。均值A是通过一组样本算出来的,均值B是已知的一个具体的值。如下图就是左边样本算出来的均值和值158的对比,此时的t统计量的公式为:

image

Python实现代码如下:

from scipy import stats
stats.ttest_1samp(data,u)

运行上面的代码会返回t统计量值和对应的p_value。

2.双样本T检验

双样本T检验是用来检验两组样本的均值之间是否有差异。两个均值都是根据样本算出来的。如下图就是左右两部分样本算出来的均值,此时的t统计量的公式为:

image

Python实现代码如下:

stats.ttest_ind(data1,data2)

3.配对样本T检验

配对样本T检验与双样本T检验有点类似,也是用来检验两组样本的均值差异,只不过普通双样本T检验中的样本是乱序的,而配对样本T检验中的样本是一一对应的。如下图所示,根据经验可得,周一至周五每天的销量不太一样,也不具有可比性,如果是双样本T检验的话就是将周一至周五的销量混在一起,然后对两组销量进行对比,但是这样显然是不太合理,正确的应该是周一和周一比,周二和周二比,总而言之,就是具有相同属性的数据之间进行相比,而不是混合总体进行相比。此时的t统计量公式为:

image

Python实现代码如下:

stats.ttest_rel(data1,data2)

张俊红
1 声望3 粉丝