先验分布、后验分布、似然分布三个应该在一起,似然估计应该分开。
前三个一起出现在贝叶斯公式,
$$P(\theta|X)=\frac{P(X|\theta)P(\theta)}{P(X)}$$
\(\theta\)是分布参数,\(X\)是所见数据,
\(P(\theta|X)\)是后验,即见过数据\(X\)影响后的分布;
\(P(\theta)\)是先验,没受\(X\)影响前的分布;
\(P(X|\theta)\)是似然,即在已知分布参数\(\theta\)下,度量生成某个样本/事件的分布
===================================
而后面的似然估计,是参数估计的思想,是求参的思想。一般都是极大似然估计,也就是怎样改变参数才能使得分布的结果更加符合所观测的数据(或者说训练数据),而具体的方法有有:
- 贝叶斯估计,也就是上述的朴素贝叶斯
( 解析解的)极大似然估计,一般求解是:
求最大似然函数估计值的一般步骤:
(1)写出似然函数;
(2)对似然函数取对数,并整理;
(3)求导数,令导数为0,得到似然方程;
(4)解似然方程,得到的参数即为所求;- 期望最大(EM)方法,即没办法求解析解的参数估计
- 以及很多深度学习加持的模型
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。