朴素貝葉斯分類 和 拉普拉斯平滑(拉普拉斯處理 laplace smoothing)


朴素貝葉斯分類是一種生成式分類

p(y|x) = p(y,x) / p(x)
=p(x|y) * p(y) | p(x)
在訓練的時候假設x的所有特征是相互獨立的,所以p(x|y) = 所有p(xi | y) 的乘積 只要通過貝葉斯展開+有xi獨立 就能得到
這個模型里的參數就是,給定y這個條件下,生成某個特征xi的概率(),以及y本身的分布(使用中心極限定理得到均值就能作為估計)

這里存在一個問題,就是如果在所有樣本里,某個特征xi沒出現過,那么根據中心極限定理得到均值就是0
那么最后的乘積就是0

這個結果對於實際來說不太合理,對於訓練樣本中沒出現過的特征,實際的測試的時候,也是有可能出現

所以需要做 拉普拉斯平滑

就是在用中心極限定理得到均值 的時候 分子分母同時加上一個數,這樣每個特征的條件概率肯定不為0了
一般分子加1,分母加的是 分類數


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM