原文:古德-圖靈估計

古德 圖靈估計可以解決n元語法模型 n gram 中的數據的稀疏問題。主要的思想是把非零的n元語法的概率降低勻給一些低概率n元語法,以修改最大似然估計與真實概率之間的偏離。是實用比較多的平滑算法。 圖:從左到右的變化:把一部分看得見的事件的概率勻給未看見的事件 以統計詞典中的概率為例,來說明古德 圖鈴公式。 假定在語料庫中出現r次的詞有Nr個,特別的出現 次 未登錄詞 出現的次數為N 個。語料庫 ...

2014-12-20 22:56 0 5464 推薦指數:

查看詳情

-圖靈估計(Good-Turing Estimate)

1953年(I.J.Good)在圖靈(Alan Turing)的指導下,提出的在統計中相信可靠的統計數據,而對不可信的統計數據打折扣的一種概率估計方法,同時將折扣出來的那一小部分概率給與未看見的時間(Unseen Events)。 圖靈還給出一個很漂亮的重新估算概率的公式,這個公式 ...

Thu Jul 02 19:18:00 CST 2020 0 638
諾模型總結

2.1. Model 1: Benchmark Model 給出 Benchmark Model 下的 逆需求函數: \(p = f(q)\) 收益函數: \(\Pi\) ...

Sun Nov 14 10:40:00 CST 2021 0 135
9 月月賽 I 游記

目錄 A [Cnoi2020]子弦 題目分析 參考代碼 B [Cnoi2020]雷雨 題目分析 參考代碼 ...

Sun Sep 20 02:03:00 CST 2020 3 614
有偏估計和無偏估計

無偏和有偏   本質來講,無偏/無偏估計是指估算統計量的公式,無偏估計就是可以預見,多次采樣計算的統計量(根據估算公式獲得)是在真實值左右兩邊。類似於正態分布的鍾型圖形。比如對於均值估計: mean = (1/n)Σxi   一定有的比μ大,有的比μ小。   那么對於有偏估計,就是多次采樣 ...

Sun Jan 19 21:17:00 CST 2020 0 3515
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM