Bootstrapping算法


所謂的Bootstrapping法就是利用有限的樣本資料經由多次重復抽樣,重新建立起足以代表母體樣本分布之新樣本。

 
統計學中,bootstrapping可以指依賴於重置隨機抽樣的一切試驗。bootstrapping可以用於計算樣本估計的准確性。對於一個采樣,我們只能計算出某個 統計量(例如 均值)的一個取值,無法知道均值統計量的分布情況。但是通過 自助法(自舉法)我們可以模擬出均值統計量的近似分布。有了分布很多事情就可以做了(比如說有你推出的結果來進而推測實際總體的情況)。
bootstrapping方法的實現很簡單,假設抽取的樣本大小為n:
在原樣本中有放回的抽樣,抽取n次。每抽一次形成一個新的樣本,重復操作,形成很多新樣本,通過這些樣本就可以計算出樣本的一個分布。新樣本的數量通常是1000-10000。如果計算成本很小,或者對精度要求比較高,就增加新樣本的數量。
優點:簡單易於操作。
缺點:bootstrapping的運用基於很多統計學假設,因此假設的成立與否會影響采樣的准確性。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM