抽样分布

  • 总体:是指研究对象的整个群体。
  • 样本:是从总体中选取的一部分,用于代表总体的整体情况。
  • 样本数量:又叫样本空间,是表示有多少个样本。
  • 样本大小:及样本的容量,表示每个样本里有多少个数据。
  • 抽样分布:将样本平均值可视化,叫做抽样分布。
  • 样本均值:一个样本中所有数据的平均值,\(\overline{x}\)。
  • 总体均值:要研究的总体中所有数据的平均值,\( \mu \)。
  • 方差:来度量随机变量和其数学期望(即均值)之间的偏离程度。
    image.png
  • 标准差:是方差的平方根。
    image.png

抽样方法

  • 简单随机抽样: 随机选取一个大小为n的样本,所有大小为n的可能样本被抽取的可能性相同,包括重复抽样和不重复抽样,具体方式有抽签或使用随机编号生成器。
  • 分层抽样:将总体分为几个单位相似的层,层与层之间尽可能不一样,分好层后对每一层进行简单随机抽样。
  • 整群抽样:将总体划分为几个群,其中每个群都尽量与其他群相似,可通过简单随机抽样抽取几个群,然后用抽取的群形成样本。
  • 系统抽样:选取一个数字K,然后每到第K个数据时就抽样一次。

中心极限定理

在适当的条件下,大量相互独立随机变量的均值经适当标准化后依分布收敛于标准正态分布。这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量之和近似服从正态分布的条件。

如何用样本来估计总体

  • 均值参数
    利用中心极限定理我们可以用样本估计出总体的平均值,样本均值约等于总体均值。

v2-051b5574e3fb8117bad08532e91d1e2d_1440w.jpg

  • 用样本估计总体方差公式
    v2-cdff25a91f9eccbd641cd3b7ce650bae_r.jpg
    注意:样本的方差是除以n,而用样本估计的总体方差是除以n-1,是因为总体的方差往往要大于样本的方差,更接近总体方差。
  • 标准误差:是求所有样本的平均值的标准差。
  • 误差:如果某个样本平均值在总体平均值的+-3个标准误差以外,我们就可以说这个样本不属于这个总体。

参考资料

https://zhuanlan.zhihu.com/p/...
https://zhuanlan.zhihu.com/p/...


wuqingfeng
0 声望0 粉丝

引用和评论

0 条评论