分类问题之 Naive Bayes
简介
-
条件概率
P(A|B)*P(B) = P(A, B) = P(B|A)*P(A)
- 全概率公式
-
分类步骤
朴素贝叶斯假设特征之间相互独立 1.计算 P(A|C0) = P(A1, A2, A3|C0) = P(A1|C0) * P(A2|C0) * P(A3|C0) 2.计算 P(A|C1) = P(A1, A2, A3|C1) = P(A1|C1) * P(A2|C1) * P(A3|C1) 3.计算 P(A, C0) = P(A|C0) * P(C0) 4.计算 P(A, C1) = P(A|C1) * P(C1) 5.不需要计算分母的 P(A) 6.如果 P(A, C0) > P(A, C1), 那么可以得出 P(C0|A) > P(C1|A), 即样例属于 C0 类
优缺点
- 抗噪,对孤立噪点噪声鲁棒
- 对不相关的属性有较强的鲁棒性
- 如果某条记录存在缺失值, 之间忽略即可
- 朴素贝叶斯假设特征之间相互独立,但实际情况并不一定如此
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。