贝叶斯算法


一、简介

贝叶斯用于描述两个条件概率之间的关系,一般,P(A|B)与P(B|A)的结果是不一样的,贝叶斯则是描述P(A|B)和P(B|A)之间的特定的关系。

公式:
\[P({A_{\rm{i}}}|B) = \frac{{P(B|{A_{\rm{i}}})P({A_i})}}{{\sum\limits_{i = 1}^n {P(B|{A_i})P({A_{\rm{i}}})} }}\]

注:\[{A_1},...,{A_n}\]是完备事件组,\[ \cup _{i = 1}^n{A_i} = \Omega ,{A_i}{A_j} = \emptyset ,P({A_i}) > 0\]

 

二、统计学中的应用

贝叶斯分类算法是统计学的一种分类方法

1、朴素贝叶斯(Navie Bayes,NB)

成立前提:各属性之间相互独立,即可以满足完备事件组。

情景:设每个数据样本用一个n维特征向量来描述n个属性的值,即:X={x1,x2,…,xn},假定有m个类,分别用C1, C2,…,Cm表示。给定一个未知的数据样本X(即没有类标号),若朴素贝叶斯分类法将未知的样本X分配给类Ci,则一定是P(Ci|X)>P(Cj|X) 1≤j≤m,j≠i

由于P(X)对于所有的属性来说,P(X)都是一样的,即是一个常数(已知),所以\[P({C_i}|X) \propto P(X|{C_i})P({C_{\rm{i}}})\]

所谓贝叶斯公式,是指当分析样本大到接近总体数时,样本中事件发生的概率将接近于总体中事件发生的概率.

 

2、TAN算法(Tree Augmented Bayes Network)

TAN算法通过发现属性对之间的依赖关系来降低NB中任意属性之间独立的假设。它是在NB网络结构的基础上增加属性对之间的关联(边)来实现的.

参考:https://blog.csdn.net/qq_26562641/article/details/50343501

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM