[機器學習&數據挖掘]朴素貝葉斯數學原理

本文轉載自查看原文 2015-06-24 21:01 2374 機器學習&數據挖掘

1、准備：

(1)先驗概率：根據以往經驗和分析得到的概率，也就是通常的概率，在全概率公式中表現是“由因求果”的果

(2)后驗概率：指在得到“結果”的信息后重新修正的概率，通常為條件概率(但條件概率不全是后驗概率)，在貝葉斯公式中表現為“執果求因”的因

例如：加工一批零件，甲加工60%，乙加工40%，甲有0.1的概率加工出次品，乙有0.15的概率加工出次品，求一個零件是不是次品的概率即為先驗概率，已經得知一個零件是次品，求此零件是甲或乙加工的概率是后驗概率

(3)全概率公式：設E為隨機試驗，B1，B2，....Bn為E的互不相容的隨機事件，且P(Bi)>0(i=1,2....n), B1 U B2 U....U Bn = S,若A是E的事件，則有

　　　　　　　　　　　　　　　　　　　　　　P(A) = P(B1)P(A|B1)+P(B2)P(A|B2)+.....+P(Bn)P(A|Bn)

(4)貝葉斯公式：設E為隨機試驗，B1，B2，....Bn為E的互不相容的隨機事件，且P(Bi)>0(i=1,2....n), B1 U B2 U....U Bn = S,E的事件A滿足P(A)>0,則有

(5)條件概率公式：P(A|B) = P(AB)/P(B)

(6)極大似然估計：極大似然估計在機器學習中想當於經驗風險最小化，(離散分布)一般流程：確定似然函數(樣本的聯合概率分布)，這個函數是關於所要估計的參數的函數，然后對其取對數，然后求導，在令導數等於0的情況下，求得參數的值，此值便是參數的極大似然估計

注：經驗風險：在度量一個模型的好壞，引入了損失函數，常見的損失函數有：0-1損失函數、平方損失函數、絕對損失函數、對數損失函數等，同時風險函數(期望風險)是對損失函數的期望，期望風險是關於聯合分布的理論期望，但是理論的聯合分布是無法求得的，只能利用樣本來估計期望，因此引入經驗風險，經驗風險就是樣本的平均損失，根據大數定理在樣本趨於無窮大的時候，這個時候經驗風險會無限趨近與期望風險

2、朴素貝葉斯算法

(1)思路：朴素貝葉斯算法的朴素在於對與特征之間看作相互獨立的意思例如：輸入向量(X1, X2,....,Xn)的各個元素是相互獨立的，因此計算概率P(X1=x1,X2=x2,....Xn=xn)=P(X1=x1)P(X2=x2)......P(Xn=xn),其次基於貝葉斯定理，對於給定的訓練數據集，首先基於特征條件獨立假設學習聯合概率分布，然后基於此模型，對於給定的輸入向量，利用貝葉斯公式求出后驗概率最大的輸出分類標簽

(2)詳細：以判斷輸入向量x的類別的計算過程來具體說下朴素貝葉斯計算過程

　　<1>要計算輸入向量x的類別，即是求在x的條件下的y的概率，當y取某值最大概率，則此值便為x的分類，則概率為P(Y=ck|X=x)

　　<2>利用條件概率公式推導貝葉斯公式(此步非必要，本人在記貝葉斯公式時習慣這么記)

　　　　由條件概率公式得P(Y=ck|X=x) = P(Y=ck,X=x)/P(X=x) = P(X=x | Y=ck)P(Y=ck)/P(X=x)

　　　　由全概率公式可得(替換P(X=x))：