其實就是計算概率的時候,對於分子+1,避免出現概率為0。這樣乘起來的時候,不至於因為某個量x,在觀察樣本庫(訓練集)中沒有出現過,會導致整個實例的概率結果是0。在文本分類的問題中,當一個詞語沒有在訓練樣本中出現,該詞語調概率為0,使用連乘計算文本出現概率時也為0。這是不合理的,不能因為一個事件沒有觀察到就武斷的認為該事件的概率是0。
其實就是計算概率的時候,對於分子+1,避免出現概率為0。這樣乘起來的時候,不至於因為某個量x,在觀察樣本庫(訓練集)中沒有出現過,會導致整個實例的概率結果是0。在文本分類的問題中,當一個詞語沒有在訓練樣本中出現,該詞語調概率為0,使用連乘計算文本出現概率時也為0。這是不合理的,不能因為一個事件沒有觀察到就武斷的認為該事件的概率是0。
本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。