Redis 存儲對象信息是用 Hash 還是 String


Redis 內部使用一個 RedisObject 對象來表示所有的 key 和 value,RedisObject 中的 type,則是代表一個 value 對象具體是何種數據類型,它包含字符串(String)、鏈表(List)、哈希結構(Hash)、集合(Set)、有序集合(Sorted set)。

日常工作中我們存儲對象信息的時候,一般有兩種做法,一種是用 Hash 存儲,另一種是 String 存儲。但好像並沒有所謂的最佳實踐,那么實際上到底用什么數據結構存儲更好呢?

首先簡單回顧下,Redis 的 Hash 和 String 結構。

String

String 數據結構是簡單的 key-value 類型,value 其實不僅是 String,也可以是數字。Redis 中的 String 可以表示很多語義:

  • 字符串(bits)

  • 整數

  • 浮點數

這三種類型,Redis 會根據具體的場景完成自動轉換,並且根據需要選取底層的承載方式。String 在Redis 內部存儲默認就是一個字符串,被 RedisObject 所引用,當遇到 incr、decr 等操作時會轉成數值型進行計算,此時 RedisObject 的 encoding 字段為int。

在存儲過程中,我們可以將用戶信息使用 Json 序列化成字符串,然后將序列化后的字符串存入 Redis 進行緩存。

String 數據結構

由於 Redis 的字符串是動態字符串,可以修改,內部結構類似於 Java 的 ArrayList,采用預分配冗余空間的方式來減少內存的頻繁分配。如上圖所示,內部為當前字符串實際分配的空間 capacity,一般高於實際字符串長度 len。

假設我們要存儲的結構是:

{
  "name": "xiaowang",
  "age": "35"
}

如果此時將此用戶信息的 name 改為“xiaoli”,再存到 Redis 中,Redis 是不需要重新分配空間的。而且我們在讀取和存儲數據的時候只需要對做 Json 序列化與反序列化,比較方便。

Hash

Hash 在很多編程語言中都有着很廣泛的應用,而在 Redis 中也是如此。在 Redis 中,Hash 常常用來緩存一些對象信息,如用戶信息、商品信息、配置信息等,因此也被稱為字典(dictionary),Redis 的字典使用 Hash table 作為底層實現, 一個 Hash table 里面可以有多個哈希表節點,而每個哈希表節點保存了字典中的一個鍵值對。實際上,Redis 數據庫底層也是采用 Hash table 來存儲鍵值對的。

Redis 的 Hash 相當於 Java 的 HashMap,內部結構實現與 HashMap 一致,即數組+鏈表結構。只是 reHash 方式不一樣。

Hash 數據結構

前面說到 String 適合存儲用戶信息,而 Hash 結構也可以存儲用戶信息,不過是對每個字段單獨存儲,因此可以在查詢時獲取部分字段的信息,節省網絡流量。不過 Redis 的 Hash 的值只能是字符串,存儲上面的那個例子還好,如果存儲的用戶信息變為:

{
  "name": "xiaowang",
  "age": 25,
  "clothes": {
    "shirt": "gray",
    "pants": "read"
  }
}

那么該如何存儲"clothes"屬性又變成了該用 String 還是 Hash 的問題。

String 和 Hash 占用內存的比較

既然兩種數據結構都可以存儲結構體信息。到底哪種更加合適呢?

首先我們用代碼先插入 10000 條數據,然后用可視化工具來看看內存的占用情況。

const Redis = require("ioRedis");
const Redis0 = new Redis({port: 6370});
const Redis1 = new Redis({port: 6371});


const user = {
  name: 'name12345',
  age: 16,
  avatar: 'https://dss3.bdstatic.com/70cFv8Sh_Q1YnxGkpoWK1HF6hhy/it/u=256767015,24101428&fm=26&gp=0.jpg',
  phone: '13111111111',
  email: '1111111@11.email',
  lastLogon: '2021-04-28 10:00:00',
}


async function main() {
  for (let i = 0; i < 10000; i++) {
    await Redis0.set(`String:user:${i}`, Json.Stringify(user));
    await Redis1.hmset(`Hash:user:${i}`, user);
  }
}

main().then(process.exit);

先看 Redis0:

再來看看 Redis1:

可以看到還是有點差距的,但是差距並不明顯。

網友討論

網上的用戶也有同樣的疑問, 因為值的長度是不確定的,所以不知道采用 String 還是 Hash 存儲更有效率。

截圖來源於 StackOverflow(Redis Strings vs Redis Hashes to represent Json: efficiency?)

這里我主要給大家翻譯下該問題下優質的答案:

適合用 String 存儲的情況:

  • 每次需要訪問大量的字段

  • 存儲的結構具有多層嵌套的時候

適合用 Hash 存儲的情況:

  • 在大多數情況中只需要訪問少量字段

  • 自己始終知道哪些字段可用,防止使用 mget 時獲取不到想要的數據

總結

本文主要介紹了Redis 存儲對象信息是用 Hash 還是 String,建議是大部分情況下使用 String 存儲就好,畢竟在存儲具有多層嵌套的對象時方便很多,占用的空間也比 Hash 小。當我們需要存儲一個特別大的對象時,而且在大多數情況中只需要訪問該對象少量的字段時,可以考慮使用 Hash。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM