SkipList 之詳細分析


SkipList

  俗稱跳表,跳表是一種隨機化的數據結構,目前開源軟件 Redis 和 LevelDB 都有用到它,它的效率和紅黑樹以及 AVL 樹不相上下,但跳表的原理相當簡單,只要你能熟練操作鏈表,就能輕松實現一個 SkipList。

有序表的搜索

考慮一個有序表:

從該有序表中搜索元素 < 23, 43, 59 > ,需要比較的次數分別為 < 2, 4, 6 >,總共比較的次數

為 2 + 4 + 6 = 12 次。有沒有優化的算法嗎?  鏈表是有序的,但不能使用二分查找。類似二叉

搜索樹,我們把一些節點提取出來,作為索引。得到如下結構:

 

這里我們把 < 14, 34, 50, 72 > 提取出來作為一級索引,這樣搜索的時候就可以減少比較次數了。

我們還可以再從一級索引提取一些元素出來,作為二級索引,變成如下結構:

 

這里元素不多,體現不出優勢,如果元素足夠多,這種索引結構就能體現出優勢來了。

這基本上就是跳表的核心思想,其實也是一種通過“空間來換取時間”的一個算法,通過在每個節點中增加了向前的指針,從而提升查找的效率。

跳表

下面的結構是就是跳表:

其中 -1 表示 INT_MIN, 鏈表的最小值,1 表示 INT_MAX,鏈表的最大值。

 

跳表具有如下性質:

(1) 由很多層結構組成

(2) 每一層都是一個有序的鏈表

(3) 最底層(Level 1)的鏈表包含所有元素

(4) 如果一個元素出現在 Level i 的鏈表中,則它在 Level i 之下的鏈表也都會出現。

(5) 每個節點包含兩個指針,一個指向同一鏈表中的下一個元素,一個指向下面一層的元素。

跳表的搜索

 

例子:查找元素 117

(1) 比較 21, 比 21 大,往后面找

(2) 比較 37,   比 37大,比鏈表最大值小,從 37 的下面一層開始找

(3) 比較 71,  比 71 大,比鏈表最大值小,從 71 的下面一層開始找

(4) 比較 85, 比 85 大,從后面找

(5) 比較 117, 等於 117, 找到了節點。

具體的搜索算法如下:

C代碼clip_image009

1.

3. find(x)  

4. { 

5.     p = top; 

6. while (1) { 

7. while (p->next->key < x) 

8.             p = p->next; 

9. if (p->down == NULL)  

10. return p->next; 

11.         p = p->down; 

12.     } 

13. } 

跳表的插入

先確定該元素要占據的層數 K(采用丟硬幣的方式,這完全是隨機的)

然后在 Level 1 ... Level K 各個層的鏈表都插入元素。

例子:插入 119, K = 2

 

如果 K 大於鏈表的層數,則要添加新的層。

例子:插入 119, K = 4

 

丟硬幣決定 K

插入元素的時候,元素所占有的層數完全是隨機的,通過一下隨機算法產生:

C代碼clip_image009[1]

1. int random_level() 

2. { 

3.     K = 1; 

4.

5. while (random(0,1)) 

6.         K++; 

7.

8. return K; 

9. } 

相當與做一次丟硬幣的實驗,如果遇到正面,繼續丟,遇到反面,則停止,

用實驗中丟硬幣的次數 K 作為元素占有的層數。顯然隨機變量 K 滿足參數為 p = 1/2 的幾何分布,

K 的期望值 E[K] = 1/p = 2. 就是說,各個元素的層數,期望值是 2 層。

跳表的高度。

n 個元素的跳表,每個元素插入的時候都要做一次實驗,用來決定元素占據的層數 K,

跳表的高度等於這 n 次實驗中產生的最大 K,待續。。。

跳表的空間復雜度分析

根據上面的分析,每個元素的期望高度為 2, 一個大小為 n 的跳表,其節點數目的

期望值是 2n。

跳表的刪除

在各個層中找到包含 x 的節點,使用標准的 delete from list 方法刪除該節點。

例子:刪除 71

源地址:http://kenby.iteye.com/blog/1187303


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM