原文:蓄水池算法的設計和實現

作者: Grey 原文地址:蓄水池算法的設計和實現 要解決的問題 假設有一個源源吐出不同球的機器, 只有裝下 個球的袋子,每一個吐出的球,要么放入袋子,要么永遠扔掉,如何做到機器吐出每一個球之后,所有吐出的球都等概率被放進袋子里 規則 吐出 到 號球,完全入袋, 引入隨機函數f i ,提供一個值i,等概率返回 i的一個數字, 當K號球吐出的時候 K gt ,我們通過以下決策決定是否要入袋 引入隨機 ...

2021-09-19 12:27 0 202 推薦指數:

查看詳情

蓄水池抽樣算法

問題定義 給你一個長度為N的鏈表。N很大,但你不知道N有多大。你的任務是從這N個元素中隨機取出k個元素。你只能遍歷這個鏈表一次。你的算法必須保證取出的元素恰好有k個,且它們是完全隨機的(出現概率均等)。 求解 蓄水池抽樣算法: 該算法是針對從一個序列中隨機抽取不重復的k個數,保證每個 ...

Wed Jun 18 00:22:00 CST 2014 1 2550
蓄水池抽樣及實現

蓄水池抽樣(Reservoir Sampling )是一個很有趣的問題,它能夠在o(n)時間內對n個數據進行等概率隨機抽取,例如:從1000個數據中等概率隨機抽取出100個。另外,如果數據集合的量特別大或者還在增長(相當於未知數據集合總量),該算法依然可以等概率抽樣。 說蓄水池抽樣之前,先說一下 ...

Tue Nov 27 21:21:00 CST 2012 0 16645
蓄水池采樣算法(Reservoir Sampling)

蓄水池采樣算法 問題描述分析 采樣問題經常會被遇到,比如: 從 100000 份調查報告中抽取 1000 份進行統計。 從一本很厚的電話簿中抽取 1000 人進行姓氏統計。 從 Google 搜索 "Ken Thompson",從中抽取 100 個結果查看哪些是今年 ...

Tue Oct 25 20:52:00 CST 2016 0 18112
蓄水池抽樣(原理&實現

前言:   蓄水池抽樣:從N個元素中隨機的等概率的抽取k個元素,其中N無法確定。 適用場景:   模式識別等概率抽樣,抽樣查看漸增的log日志(無法先保存整個數據流然后再從中選取,而是期望有一種將數據流遍歷一遍就得到所選取的元素,並且保證得到的元素是隨機的算法)。 偽代碼 ...

Thu Feb 25 01:49:00 CST 2016 0 1634
算法34】蓄水池抽樣算法 (Reservoir Sampling Algorithm)

蓄水池抽樣算法簡介 蓄水池抽樣算法隨機算法的一種,用來從 N 個樣本中隨機選擇 K 個樣本,其中 N 非常大(以至於 N 個樣本不能同時放入內存)或者 N 是一個未知數。其時間復雜度為 O(N),包含下列步驟 (假設有一維數組 S, 長度未知,需要從中隨機選擇 k 個元素, 數組下標 ...

Wed Jul 15 06:50:00 CST 2015 0 8377
Reservoir Sampling 蓄水池抽樣算法,經典抽樣

隨機讀取數據,如何保證真隨機是不可能的,因為計算機的隨機函數是偽隨機的。 但是在不考慮計算機隨機函數的情況下,如何保證數據的隨機采樣呢? 1.系統提供的shuffle函數   C++/Java都 ...

Wed Oct 29 01:05:00 CST 2014 1 7459
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM