先验分布、后验分布、似然分布三个应该在一起,似然估计应该分开。

前三个一起出现在贝叶斯公式,
$$P(\theta|X)=\frac{P(X|\theta)P(\theta)}{P(X)}$$

\(\theta\)是分布参数,\(X\)是所见数据,
\(P(\theta|X)\)是后验,即见过数据\(X\)影响后的分布;
\(P(\theta)\)是先验,没受\(X\)影响前的分布;
\(P(X|\theta)\)是似然,即在已知分布参数\(\theta\)下,度量生成某个样本/事件的分布

===================================
而后面的似然估计,是参数估计的思想,是求参的思想。一般都是极大似然估计,也就是怎样改变参数才能使得分布的结果更加符合所观测的数据(或者说训练数据),而具体的方法有有:

  1. 贝叶斯估计,也就是上述的朴素贝叶斯
  2. ( 解析解的)极大似然估计,一般求解是:

    求最大似然函数估计值的一般步骤:
    (1)写出似然函数;
    (2)对似然函数取对数,并整理;
    (3)求导数,令导数为0,得到似然方程;
    (4)解似然方程,得到的参数即为所求;
  3. 期望最大(EM)方法,即没办法求解析解的参数估计
  4. 以及很多深度学习加持的模型

Yonggie
95 声望4 粉丝