一、redis-cluster設計
Redis集群搭建的方式有多種,例如使用zookeeper等,但從redis 3.0之后版本支持redis-cluster集群,Redis-Cluster采用無中心結構,每個節點保存數據和整個集群狀態,每個節點都和其他所有節點連接。其redis-cluster架構圖如下:
其結構特點:
1、所有的redis節點彼此互聯(PING-PONG機制),內部使用二進制協議優化傳輸速度和帶寬。
2、節點的fail是通過集群中超過半數的節點檢測失效時才生效。
3、客戶端與redis節點直連,不需要中間proxy層.客戶端不需要連接集群所有節點,連接集群中任何一個可用節點即可。
4、redis-cluster把所有的物理節點映射到[0-16383]slot上(不一定是平均分配),cluster 負責維護node<->slot<->value。
5、Redis集群預分好16384個桶,當需要在 Redis 集群中放置一個 key-value 時,根據 CRC16(key) mod 16384的值,決定將一個key放到哪個桶中。
1、redis cluster節點分配
現在我們是三個主節點分別是:A, B, C 三個節點,它們可以是一台機器上的三個端口,也可以是三台不同的服務器。那么,采用哈希槽 (hash slot)的方式來分配16384個slot 的話,它們三個節點分別承擔的slot 區間是:
節點A覆蓋0-5460;
節點B覆蓋5461-10922;
節點C覆蓋10923-16383.
獲取數據:
如果存入一個值,按照redis cluster哈希槽的算法: CRC16('key')384 = 6782。 那么就會把這個key 的存儲分配到 B 上了。同樣,當我連接(A,B,C)任何一個節點想獲取'key'這個key時,也會這樣的算法,然后內部跳轉到B節點上獲取數據
新增一個主節點:
新增一個節點D,redis cluster的這種做法是從各個節點的前面各拿取一部分slot到D上,我會在接下來的實踐中實驗。大致就會變成這樣:
節點A覆蓋1365-5460
節點B覆蓋6827-10922
節點C覆蓋12288-16383
節點D覆蓋0-1364,5461-6826,10923-12287
同樣刪除一個節點也是類似,移動完成后就可以刪除這個節點了。
2、Redis Cluster主從模式
redis cluster 為了保證數據的高可用性,加入了主從模式,一個主節點對應一個或多個從節點,主節點提供數據存取,從節點則是從主節點拉取數據備份,當這個主節點掛掉后,就會有這個從節點選取一個來充當主節點,從而保證集群不會掛掉。
上面那個例子里, 集群有ABC三個主節點, 如果這3個節點都沒有加入從節點,如果B掛掉了,我們就無法訪問整個集群了。A和C的slot也無法訪問。
所以我們在集群建立的時候,一定要為每個主節點都添加了從節點, 比如像這樣, 集群包含主節點A、B、C, 以及從節點A1、B1、C1, 那么即使B掛掉系統也可以繼續正確工作。
B1節點替代了B節點,所以Redis集群將會選擇B1節點作為新的主節點,集群將會繼續正確地提供服務。 當B重新開啟后,它就會變成B1的從節點。
不過需要注意,如果節點B和B1同時掛了,Redis集群就無法繼續正確地提供服務了。
二、redis集群的搭建
集群中至少應該有奇數個節點,所以至少有三個節點,每個節點至少有一個備份節點,所以下面使用6節點(主節點、備份節點由redis-cluster集群確定)。
1、安裝redis
# tar xf redis-3.2.5.tar.gz
# cd redis-3.2.5/
# make
# make install PREFIX=/usr/local/redis-cluster
# cd /usr/local/redis-cluster/
# mv bin redis01
# cd redis01
從解壓后后目錄里 復制一份redis.conf 到 redis01目錄下
修改內容:
cluster-enabled yes #開啟cluster,去掉注釋 cluster-config-file nodes.conf cluster-node-timeout 15000 appendonly yes
復制六份,修改對應的端口號
2、安裝redis-trib所需的 ruby腳本
復制redis解壓文件src下的redis-trib.rb文件到redis-cluster目錄
[root@db01 redis-cluster]# cp /soft/redis-3.2.5/src/redis-trib.rb ./
安裝ruby環境
[root@localhost redis-cluster]# yum install ruby [root@localhost redis-cluster]# yum install rubygems
安裝redis-trib.rb運行依賴的ruby的包redis-3.2.2.gem,下載
[root@localhost redis-cluster]# gem install redis-3.2.2.gem
3、啟動所有的redis節點
可以寫一個命令腳本start-all.sh
[root@db01 redis-cluster]# cat start-all.sh cd redis01 ./redis-server redis.conf cd ../redis02 ./redis-server redis.conf cd ../redis03 ./redis-server redis.conf cd ../redis04 ./redis-server redis.conf cd ../redis05 ./redis-server redis.conf cd ../redis06 ./redis-server redis.conf cd ..
[root@localhost redis-cluster]# chmod +x start-all.sh [root@localhost redis-cluster]# ./start-all.sh
[root@localhost redis-cluster]# ps -ef | grep redis
root 4547 1 0 23:12 ? 00:00:00 ./redis-server 127.0.0.1:7001 [cluster]
root 4551 1 0 23:12 ? 00:00:00 ./redis-server 127.0.0.1:7002 [cluster]
root 4555 1 0 23:12 ? 00:00:00 ./redis-server 127.0.0.1:7003 [cluster]
root 4559 1 0 23:12 ? 00:00:00 ./redis-server 127.0.0.1:7004 [cluster]
root 4563 1 0 23:12 ? 00:00:00 ./redis-server 127.0.0.1:7005 [cluster]
root 4567 1 0 23:12 ? 00:00:00 ./redis-server 127.0.0.1:7006 [cluster]
root 4840 4421 0 23:26 pts/1 00:00:00 grep --color=auto redis
可以看到redis的6個節點已經啟動成功
殺死全部的節點:
pkill -9 redis
4、使用redis-trib.rb創建集群
[root@localhost redis-cluster]# ./redis-trib.rb create --replicas 1 127.0.0.1:7001 127.0.0.1:7002 127.0.0.1:7003 127.0.0.1:7004 127.0.0.1:7005 127.0.0.1:7006
使用create命令 --replicas 1 參數表示為每個主節點創建一個從節點,其他參數是實例的地址集合。
>>> Creating cluster >>> Performing hash slots allocation on 6 nodes... Using 3 masters: 127.0.0.1:7001 127.0.0.1:7002 127.0.0.1:7003 Adding replica 127.0.0.1:7004 to 127.0.0.1:7001 Adding replica 127.0.0.1:7005 to 127.0.0.1:7002 Adding replica 127.0.0.1:7006 to 127.0.0.1:7003 M: dfd510594da614469a93a0a70767ec9145aefb1a 127.0.0.1:7001 slots:0-5460 (5461 slots) master M: e02eac35110bbf44c61ff90175e04d55cca097ff 127.0.0.1:7002 slots:5461-10922 (5462 slots) master M: 4385809e6f4952ecb122dbfedbee29109d6bb234 127.0.0.1:7003 slots:10923-16383 (5461 slots) master S: ec02c9ef3acee069e8849f143a492db18d4bb06c 127.0.0.1:7004 replicates dfd510594da614469a93a0a70767ec9145aefb1a S: 83e5a8bb94fb5aaa892cd2f6216604e03e4a6c75 127.0.0.1:7005 replicates e02eac35110bbf44c61ff90175e04d55cca097ff S: 10c097c429ca24f8720986c6b66f0688bfb901ee 127.0.0.1:7006 replicates 4385809e6f4952ecb122dbfedbee29109d6bb234 Can I set the above configuration? (type 'yes' to accept): yes >>> Nodes configuration updated >>> Assign a different config epoch to each node >>> Sending CLUSTER MEET messages to join the cluster Waiting for the cluster to join...... >>> Performing Cluster Check (using node 127.0.0.1:7001) M: dfd510594da614469a93a0a70767ec9145aefb1a 127.0.0.1:7001 slots:0-5460 (5461 slots) master M: e02eac35110bbf44c61ff90175e04d55cca097ff 127.0.0.1:7002 slots:5461-10922 (5462 slots) master M: 4385809e6f4952ecb122dbfedbee29109d6bb234 127.0.0.1:7003 slots:10923-16383 (5461 slots) master M: ec02c9ef3acee069e8849f143a492db18d4bb06c 127.0.0.1:7004 slots: (0 slots) master replicates dfd510594da614469a93a0a70767ec9145aefb1a M: 83e5a8bb94fb5aaa892cd2f6216604e03e4a6c75 127.0.0.1:7005 slots: (0 slots) master replicates e02eac35110bbf44c61ff90175e04d55cca097ff M: 10c097c429ca24f8720986c6b66f0688bfb901ee 127.0.0.1:7006 slots: (0 slots) master replicates 4385809e6f4952ecb122dbfedbee29109d6bb234 [OK] All nodes agree about slots configuration. >>> Check for open slots... >>> Check slots coverage... [OK] All 16384 slots covered.
上面顯示創建成功,有3個主節點,3個從節點,每個節點都是成功連接狀態。
3個主節點[M]以及分配的哈希卡槽如下:
M: dfd510594da614469a93a0a70767ec9145aefb1a 127.0.0.1:7001 slots:0-5460 (5461 slots) master M: e02eac35110bbf44c61ff90175e04d55cca097ff 127.0.0.1:7002 slots:5461-10922 (5462 slots) master M: 4385809e6f4952ecb122dbfedbee29109d6bb234 127.0.0.1:7003 slots:10923-16383 (5461 slots) master
3個從節點[S]以及附屬的主節點如下:
S: ec02c9ef3acee069e8849f143a492db18d4bb06c 127.0.0.1:7004 replicates dfd510594da614469a93a0a70767ec9145aefb1a S: 83e5a8bb94fb5aaa892cd2f6216604e03e4a6c75 127.0.0.1:7005 replicates e02eac35110bbf44c61ff90175e04d55cca097ff S: 10c097c429ca24f8720986c6b66f0688bfb901ee 127.0.0.1:7006 replicates 4385809e6f4952ecb122dbfedbee29109d6bb234
以上集群安裝成功了
三、redis集群的測試
1、測試存取值
客戶端連接集群redis-cli需要帶上 -c ,redis-cli -c -p 端口號
[root@localhost redis01]# ./redis-cli -c -p 7001 127.0.0.1:7001> set name andy -> Redirected to slot [5798] located at 127.0.0.1:7002 OK 127.0.0.1:7002> get name "andy" 127.0.0.1:7002>
根據redis-cluster的key值分配,name應該分配到節點7002[5461-10922]上,上面顯示redis cluster自動從7001跳轉到了7002節點。
我們可以測試一下7006從節點獲取name值
[root@localhost redis06]# ./redis-cli -c -p 7006 127.0.0.1:7006> get name -> Redirected to slot [5798] located at 127.0.0.1:7002 "andy" 127.0.0.1:7002>
7006位7003的從節點,從上面也是自動跳轉至7002獲取值,這也是redis cluster的特點,它是去中心化,每個節點都是對等的,連接哪個節點都可以獲取和設置數據。
四、集群
節點選舉
現在模擬將7001節點掛掉,按照redis-cluster原理會選舉會將 7001的從節點7004選舉為主節點。
[root@db01 redis-cluster]# ps -ef |grep redis root 12614 1 0 14:55 ? 00:00:04 ./redis-server 127.0.0.1:7002 [cluster] root 12618 1 0 14:55 ? 00:00:04 ./redis-server 127.0.0.1:7002 [cluster] root 12622 1 0 14:55 ? 00:00:04 ./redis-server 127.0.0.1:7003 [cluster] root 12626 1 0 14:55 ? 00:00:04 ./redis-server 127.0.0.1:7004 [cluster] root 12630 1 0 14:55 ? 00:00:04 ./redis-server 127.0.0.1:7005 [cluster] root 12634 1 0 14:55 ? 00:00:04 ./redis-server 127.0.0.1:7006 [cluster] root 13370 8793 0 16:08 pts/0 00:00:00 grep --color=auto redis
kill -9 12614
在查看集群中的7001節點
[root@db01 redis-cluster]# ./redis-trib.rb check 127.0.0.1:7004 >>> Performing Cluster Check (using node 127.0.0.1:7004) M: d8ab0ba1c7c8db0aa8512c4a1ccfe5f0bf248841 127.0.0.1:7004 slots:0-5460 (5461 slots) master 0 additional replica(s) S: b03cf52d5423b3076269bbd1824bcb9dc38931e9 127.0.0.1:7005 slots: (0 slots) slave replicates 86a2ad43cc81025505e6b6abb9672f0d9e560711 M: 86a2ad43cc81025505e6b6abb9672f0d9e560711 127.0.0.1:7002 slots:5461-10922 (5462 slots) master 1 additional replica(s) S: d79c9cc52fb5ce4315bed3532ef92f09dffb985d 127.0.0.1:7006 slots: (0 slots) slave replicates 1507d656f4fbd049502397c71b2be16c8c6c2a23 M: 1507d656f4fbd049502397c71b2be16c8c6c2a23 127.0.0.1:7003 slots:10923-16383 (5461 slots) master 1 additional replica(s) [OK] All nodes agree about slots configuration. >>> Check for open slots... >>> Check slots coverage... [OK] All 16384 slots covered.
可以看到集群連接不了7001節點,重定向到附近節點7002獲取到 key對應的值
[root@db01 redis01]# ./redis-cli -c -p 7001 127.0.0.1:7001> get name -> Redirected to slot [5798] located at 127.0.0.1:7002 "andy" 127.0.0.1:7002>
將7001重新加入集群后,發現 與他對應的7004 已經變成master而7001變成了salve
[root@db01 redis01]# ./redis-server redis.conf [root@db01 redis01]# cd .. [root@db01 redis-cluster]# ./redis-trib.rb check 127.0.0.1:7001 >>> Performing Cluster Check (using node 127.0.0.1:7001) S: 6317ce2a62d55fa610673ff5be094a369efdf7f1 127.0.0.1:7001 slots: (0 slots) slave replicates d8ab0ba1c7c8db0aa8512c4a1ccfe5f0bf248841 M: d8ab0ba1c7c8db0aa8512c4a1ccfe5f0bf248841 127.0.0.1:7004 slots:0-5460 (5461 slots) master 1 additional replica(s) M: 86a2ad43cc81025505e6b6abb9672f0d9e560711 127.0.0.1:7002 slots:5461-10922 (5462 slots) master 1 additional replica(s) S: d79c9cc52fb5ce4315bed3532ef92f09dffb985d 127.0.0.1:7006 slots: (0 slots) slave replicates 1507d656f4fbd049502397c71b2be16c8c6c2a23 M: 1507d656f4fbd049502397c71b2be16c8c6c2a23 127.0.0.1:7003 slots:10923-16383 (5461 slots) master 1 additional replica(s) S: b03cf52d5423b3076269bbd1824bcb9dc38931e9 127.0.0.1:7005 slots: (0 slots) slave replicates 86a2ad43cc81025505e6b6abb9672f0d9e560711 [OK] All nodes agree about slots configuration. >>> Check for open slots... >>> Check slots coverage... [OK] All 16384 slots covered.