Redis系列(六)-SortedSets設計技巧


閱讀目錄:

  1. 介紹
  2. Score占位
  3. 更多位信息
  4. 總結

介紹

Redis Sorted Sets是類似Redis Sets數據結構,不允許重復項的String集合。不同的是Sorted Sets中的每個成員都分配了一個分數值(score),它用於在Sorted Sets中進行成員排序,從最小值到最大值。Sorted Sets中所有的成員都是唯一的,其分數(score)是可以重復的,即是說一個分數可能會對應多個值。

用Sorted Sets可以非常快的進行添加、刪除、或更新成員,其復雜度是O(m*log(n)),m是添加或查詢的成員數量。因為成員是按照順序添加的,所以可以非常快的通過score或者索引進行范圍查詢。訪問Sorted Sets中間的元素也是非常快的,因此可以用sort sets作為一個不重復的小型有序列表。 通過Sorted Sets可以快速操作任何你想做的事情:排序的成員,判斷成員是否在集合中,快速訪問集合中間的成員。

如果多次添加相同的值到Sorted Sets上,redis會以最后一次的值分數為准。

總的來說,在其他數據庫比較難完成的任務,用Sorted Sets可以更快更優性能的完成。

更多Sorted Sets的用法可以查看官方文檔。

Score占位

Sorted Sets中的Score是個64位整數類型,其范圍在-9007199254740992到9007199254740992之間,這是一個非常有用的關鍵點。

我們通常可以用它進行簡單的范圍查詢,比如把年齡當分數,通過ZRANGEBYSCORE查詢某個年齡段的所有用戶。
查詢18-35年齡的用戶:

ZRANGEBYSCORE user 18 35

如果有更復雜的需求,比如通過日期,用戶類型等來查詢,就比較困難了。 如果用其他數據結構的話,想查詢多條時就要多次往返操作,有性能上的損耗。 這里可以用Score整數類型的長度特性,來存儲查詢的條件信息。

比如有些數據需要通過日期范圍查詢,這是個很常見的場景。

使用Sorted Sets當存儲的數據結構,添加key時把日期進行簡單的轉碼。

一年有365天,在score中預留三位來存儲天份,通過DayOfYear計算出一年第多少天:

var time1=DateTime.Now.DayOfYear

因為第100天前的數據不滿三位,需要進行用0補全,寫個方法:

string AutoCompletion(int length, int num)
    {
        string str = num.ToString();
        if (str.Length > length)
            throw new Exception("max length");
        var real = length - str.Length;
        var sb = new StringBuilder(length);
        for (int j = 0; j < real; j++)
        {
            sb.Append((char) 48);
        }
        sb.Append(str);
        return sb.ToString();
    }

因為數據的日期可能跨年,在天位前預留2位,存儲年份。現在長度是5位,如15200表示的是15年19號(第200天)。 

通過年份+天數計算出當前數據項score的值。

var score= long.Parse(dateTime.Year.ToString().Substring(2, 2) + AutoCompletion(3, dateTime.DayOfYear));

把實際值和分數值存儲到redis里面:

ZADD test socre value

查詢時把需要查詢的日期范圍轉換到分數,這里查詢前10天的數據:

        int time1 = DateTime.Now.DayOfYear;
        var score1 = AutoCompletion(time1, 2) + AutoCompletion(DateTime.Now.DayOfYear, 3);

        int time2 = DateTime.Now.DayOfYear;
        var score2 = AutoCompletion(time1, 2) + AutoCompletion(DateTime.Now.AddDays(-10).ToLocalTime().DayOfYear, 3);

在redis中查詢:

ZRANGEBYSCORE user score1 score2

查詢當天(分數)下的信息:

ZRANGEBYSCORE user score2 score2 

更多位信息

r64位整數類型有16個位置,意味着還可以存儲更多維度信息。這里以日期為主,在增加個類型維度,日期位置左移4位,預留4位來存儲類型維度。

如152003456,其3456四位是存儲類型的,可以根據類型種類的多少可以增加位或減少位占用。

如果單純以日期來查詢時,類型不用傳,后面4位在查詢時補千位最小值和最大值即可。

查詢前10天的數據:

ZRANGEBYSCORE user 151900000 152009999

查詢15年19號3578類型的數據:

ZRANGEBYSCORE user 152003578 152003578 

查詢15年19號1000-4000類型的數據:

ZRANGEBYSCORE user 152001000 152004000

關於類型往往不是簡單的數據類型那么簡單,可以做個簡單的mapping表。

abcd 1000
dcda 1001
以此類推...

在添加時或查詢時注意轉換。

總結

需要注意的是score是整數類型按從小到大排序存儲的,按照上面的設計是不能在指定類型的情況下,進行日期范圍查找的,因為我們定義日期作為主維度。

通常在數據庫中有很多層級關系的表,比如大分類、子分類、小分類等一級一級遞減。 使用Sorted Sets我們可以模擬這種關系去設計Score值,主維度->次維度->低維度,這樣就可以更快的進行范圍分類信息的查詢,有個前提是64位整數的位置夠用。

如果沒有類似的需求,可以使用時間戳作為值的分數值,這樣就不需要額外的轉換了。

簡單分享了Sorted Sets存儲設計的經驗,希望對大家有所幫助。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM