Redis數據結構——跳躍表


前言

      跳躍表是一種有序的數據結構,它通過在每個節點中維持多個指向其他節點的指針,從而達到快速訪問節點的目的。這么說,我們可能很難理解,我們可以先回憶一下鏈表。

一、復習跳躍表

1.1 什么是跳躍表

    對於一個單鏈表來講,即便鏈表中存儲的數據是有序的,如果我們要想在其中查找某個數據,也只能從頭到尾遍歷鏈表。這樣查找效率就會很低,時間復雜度會很高,是 O(n)。

單鏈表

    如果我們想要提高其查找效率,可以考慮在鏈表上建索引的方式。每兩個結點提取一個結點到上一級,我們把抽出來的那一級叫作索引。 一層跳躍表

    這個時候,我們假設要查找節點8,我們可以先在索引層遍歷,當遍歷到索引層中值為 7 的結點時,發現下一個節點是9,那么要查找的節點8肯定就在這兩個節點之間。我們下降到鏈表層繼續遍歷就找到了8這個節點。原先我們在單鏈表中找到8這個節點要遍歷8個節點,而現在有了一級索引后只需要遍歷五個節點。

    從這個例子里,我們看出,加來一層索引之后,查找一個結點需要遍的結點個數減少了,也就是說查找效率提高了,同理再加一級索引。

二層跳躍表

    從圖中我們可以看出,查找效率又有提升。在例子中我們的數據很少,當有大量的數據時,我們可以增加多級索引,其查找效率可以得到明顯提升。

跳躍表

    像這種鏈表加多級索引的結構,就是跳躍表!

二、Redis跳躍表

    Redis使用跳躍表作為有序集合鍵的底層實現之一,如果一個有序集合包含的元素數量比較多,又或者有序集合中元素的成員是比較長的字符串時, Redis就會使用跳躍表來作為有序集合健的底層實現。

    這里我們需要思考一個問題——為什么元素數量比較多或者成員是比較長的字符串的時候Redis要使用跳躍表來實現?

    從上面我們可以知道,跳躍表在鏈表的基礎上增加了多級索引以提升查找的效率,但其是一個空間換時間的方案,必然會帶來一個問題——索引是占內存的。原始鏈表中存儲的有可能是很大的對象,而索引結點只需要存儲關鍵值值和幾個指針,並不需要存儲對象,因此當節點本身比較大或者元素數量比較多的時候,其優勢必然會被放大,而缺點則可以忽略。

2.1 Redis中跳躍表的實現

    Redis的跳躍表由zskiplistNode和skiplist兩個結構定義,其中 zskiplistNode結構用於表示跳躍表節點,而 zskiplist結構則用於保存跳躍表節點的相關信息,比如節點的數量,以及指向表頭節點和表尾節點的指針等等。

Redis跳躍表

      上圖展示了一個跳躍表示例,其中最左邊的是 skiplist結構,該結構包含以下屬性。

  • header:指向跳躍表的表頭節點,通過這個指針程序定位表頭節點的時間復雜度就為O(1)

  • tail:指向跳躍表的表尾節點,通過這個指針程序定位表尾節點的時間復雜度就為O(1)

  • level:記錄目前跳躍表內,層數最大的那個節點的層數(表頭節點的層數不計算在內),通過這個屬性可以再O(1)的時間復雜度內獲取層高最好的節點的層數。

  • length:記錄跳躍表的長度,也即是,跳躍表目前包含節點的數量(表頭節點不計算在內),通過這個屬性,程序可以再O(1)的時間復雜度內返回跳躍表的長度。

    結構右方的是四個 zskiplistNode結構,該結構包含以下屬性

  • 層(level):

        節點中用1、2、L3等字樣標記節點的各個層,L1代表第一層,L代表第二層,以此類推。

        每個層都帶有兩個屬性:前進指針和跨度。前進指針用於訪問位於表尾方向的其他節點,而跨度則記錄了前進指針所指向節點和當前節點的距離(跨度越大、距離越遠)。在上圖中,連線上帶有數字的箭頭就代表前進指針,而那個數字就是跨度。當程序從表頭向表尾進行遍歷時,訪問會沿着層的前進指針進行。

        每次創建一個新跳躍表節點的時候,程序都根據冪次定律(powerlaw,越大的數出現的概率越小)隨機生成一個介於1和32之間的值作為level數組的大小,這個大小就是層的“高度”。

  • 后退(backward)指針:

        節點中用BW字樣標記節點的后退指針,它指向位於當前節點的前一個節點。后退指針在程序從表尾向表頭遍歷時使用。與前進指針所不同的是每個節點只有一個后退指針,因此每次只能后退一個節點。

  • 分值(score):

        各個節點中的1.0、2.0和3.0是節點所保存的分值。在跳躍表中,節點按各自所保存的分值從小到大排列。

  • 成員對象(oj):

        各個節點中的o1、o2和o3是節點所保存的成員對象。在同一個跳躍表中,各個節點保存的成員對象必須是唯一的,但是多個節點保存的分值卻可以是相同的:分值相同的節點將按照成員對象在字典序中的大小來進行排序,成員對象較小的節點會排在前面(靠近表頭的方向),而成員對象較大的節點則會排在后面(靠近表尾的方向)。

zskiplistNode

2.2 Redis跳躍表常用操作的時間復雜度

操作 時間復雜度
創建一個跳躍表 O(1)
釋放給定跳躍表以及其中包含的節點 O(N)
添加給定成員和分值的新節點 平均O(logN),最壞O(logN)(N為跳躍表的長度)
刪除除跳躍表中包含給定成員和分值的節點 平均O(logN),最壞O(logN)(N為跳躍表的長度)
返回給定成員和分值的節點再表中的排位 平均O(logN),最壞O(logN)(N為跳躍表的長度)
返回在給定排位上的節點 平均O(logN),最壞O(logN)(N為跳躍表的長度)
給定一個分值范圍,返回跳躍表中第一個符合這個范圍的節點 O(1)
給定一個分值范圍,返回跳躍表中最后一個符合這個范圍的節點 平均O(logN),最壞O(logN)(N為跳躍表的長度)
給定一個分值范圍,除跳躍表中所有在這個范圍之內的節點 平均O(logN),最壞O(logN)(N為跳躍表的長度)
給定一個排位范圍,鼎除跳躍表中所有在這個范圍之內的節點 O(N),N為被除節點數量
給定一個分值范固(range),比如0到15,20到28,諸如此類,如果跳氏表中有至少一個節點的分值在這個范間之內,那么返回1,否則返回0 O(N),N為被除節點數量

本文重點

  • 跳躍表基於單鏈表加索引的方式實現
  • 跳躍表以空間換時間的方式提升了查找速度
  • Redis有序集合在節點元素較大或者元素數量較多時使用跳躍表實現
  • Redis的跳躍表實現由 zskiplist和 zskiplistnode兩個結構組成,其中 zskiplist用於保存跳躍表信息(比如表頭節點、表尾節點、長度),而zskiplistnode則用於表示跳躍表節點
  • Redis每個跳躍表節點的層高都是1至32之間的隨機數
  • 在同一個跳躍表中,多個節點可以包含相同的分值,但每個節點的成員對象必須是唯一的跳躍表中的節點按照分值大小進行排序,當分值相同時,節點按照成員對象的大小進行排序。

小結

    跳躍表可能對我們來說是一種的稍陌生的數據結構。本篇文章簡單介紹了跳躍表這種數據結構,並且分析了Redis中跳躍表的使用。下篇文章將繼續分享Redis中用到的數據結構整數集合。敬請關注!

參考

《Redis設計與實現》

《Redis開發與運維》

《Redis官方文檔》

-----END-----


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM