mongodb是最常用的nosql數據庫,在數據庫排名中已經上升到了前六。這篇文章介紹如何搭建高可用的mongodb(分片+副本)集群。
在搭建集群之前,需要首先了解幾個概念:路由,分片、副本集、配置服務器等。
相關概念
從圖中可以看到有四個組件:mongos、config server、shard、replica set。
1.mongos,數據庫集群請求的入口,所有的請求都通過mongos進行協調,不需要在應用程序添加一個路由選擇器,mongos自己就是一個請求分發中心,它負責把對應的數據請求請求轉發到對應的shard服務器上。在生產環境通常有多mongos作為請求的入口,防止其中一個掛掉所有的mongodb請求都沒有辦法操作。
2.config server,顧名思義為配置服務器,存儲所有數據庫元信息(路由、分片)的配置。mongos本身沒有物理存儲分片服務器和數據路由信息,只是緩存在內存里,配置服務器則實際存儲這些數據。mongos第一次啟動或者關掉重啟就會從 config server 加載配置信息,以后如果配置服務器信息變化會通知到所有的 mongos 更新自己的狀態,這樣 mongos 就能繼續准確路由。在生產環境通常有多個 config server 配置服務器,因為它存儲了分片路由的元數據,防止數據丟失!
3.shard,分片(sharding)是指將數據庫拆分,將其分散在不同的機器上的過程。將數據分散到不同的機器上,不需要功能強大的服務器就可以存儲更多的數據和處理更大的負載。基本思想就是將集合切成小塊,這些塊分散到若干片里,每個片只負責總數據的一部分,最后通過一個均衡器來對各個分片進行均衡(數據遷移)。
4.replica set,中文翻譯副本集,其實就是shard的備份,防止shard掛掉之后數據丟失。復制提供了數據的冗余備份,並在多個服務器上存儲數據副本,提高了數據的可用性, 並可以保證數據的安全性。
5.仲裁者(Arbiter),是復制集中的一個MongoDB實例,它並不保存數據。仲裁節點使用最小的資源並且不要求硬件設備,不能將Arbiter部署在同一個數據集節點中,可以部署在其他應用服務器或者監視服務器中,也可部署在單獨的虛擬機中。為了確保復制集中有奇數的投票成員(包括primary),需要添加仲裁節點做為投票,否則primary不能運行時不會自動切換primary。
簡單了解之后,我們可以這樣總結一下,應用請求mongos來操作mongodb的增刪改查,配置服務器存儲數據庫元信息,並且和mongos做同步,數據最終存入在shard(分片)上,為了防止數據丟失同步在副本集中存儲了一份,仲裁在數據存儲到分片的時候決定存儲到哪個節點。
環境准備
系統系統 Ubuntu 18.04.1 LTS 三台服務器:10.20.71.135/10.20.73.182/10.20.70.61 安裝包:mongodb-org-server_4.0.6_amd64.deb
服務器規划
服務器mongo-135 服務器mongo-182 服務器mongo-61
mongos mongos mongos
config server config server config server
shard server1 主節點 shard server1 副節點 shard server1 仲裁
shard server2 仲裁 shard server2 主節點 shard server2 主節點
shard server3 副節點 shard server3 仲裁 shard server3 主節點
端口分配:
mongos:20000
config:21000
shard1:27017
shard2:27017
shard3:27017
集群搭建
1. mongodb源配置
sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv 9DA31620334BD75D9DCB49F368818C72E52529D4
echo "deb [ arch=amd64 ] https://repo.mongodb.org/apt/ubuntu bionic/mongodb-org/4.0 multiverse" | sudo tee /etc/apt/sources.list.d/mongodb-org-4.0.list
sudo apt-get update
會安裝對應源的mongo所有依賴包,此處不執行
# sudo apt-get install -y mongodb-org
echo "mongodb-org hold" | sudo dpkg --set-selections
echo "mongodb-org-server hold" | sudo dpkg --set-selections
echo "mongodb-org-shell hold" | sudo dpkg --set-selections
echo "mongodb-org-mongos hold" | sudo dpkg --set-selections
echo "mongodb-org-tools hold" | sudo dpkg --set-selections
# 安裝依賴
apt install -y mongodb-org-mongos mongodb-org-shell mongodb-org-tools
參考
2. mongodb安裝
wget https://repo.mongodb.org/apt/ubuntu/dists/bionic/mongodb-org/4.0/multiverse/binary-amd64/mongodb-org-server_4.0.6_amd64.deb
dpkg -i mongodb-org-server_4.0.6_amd64.deb
分別在每台機器建立conf、mongos、config、shard1、shard2、shard3六個目錄,因為mongos不存儲數據,只需要建立日志文件目錄即可。
mkdir -p /usr/local/mongodb/conf
mkdir -p /usr/local/mongodb/mongos/log
mkdir -p /usr/local/mongodb/configsvr/{data,log}
mkdir -p /usr/local/mongodb/shard1/{date,log}
mkdir -p /usr/local/mongodb/shard2/{data,log}
mkdir -p /usr/local/mongodb/shard3/{data,log}
准備集群間通信使用的加密key
創建mongod、mongos之間通信所使用的key文件,在任意一台服務器上執行:
openssl rand -base64 756 > /etc/mongodb/conf/key
chmod 400 /data/mongodb/conf/key
# 將/data/mongodb/conf/key文件拷貝到其它服務器上,保持文件權限不變
connfig server配置服務器
mongodb3.4以后要求配置服務器也創建副本集,不然集群搭建不成功。添加配置文件
root@mgo-db01cn-p001:/data/mongodb/conf# cat configsrv.conf
storage:
dbPath: /data/mongodb/config/data
journal:
enabled: true
systemLog:
destination: file
logAppend: true
path: /data/mongodb/config/log/configsrv.log
net:
port: 21000
bindIp: 0.0.0.0
processManagement:
timeZoneInfo: /usr/share/zoneinfo
security:
keyFile: /data/mongodb/conf/key
authorization: enabled
replication:
replSetName: configs
sharding:
clusterRole: "configsvr"
分別啟動三台服務器的config server 方式一:
mongod -f /data/mongodb/conf/configsrv.conf
方式二:
root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongosrv.service
[Unit]
Description=MongoDB Database Config Server
After=network.target
Documentation=https://docs.mongodb.org/manual
[Service]
User=mongodb
Group=mongodb
EnvironmentFile=-/etc/default/mongod
ExecStart=/usr/bin/mongod --config /data/mongodb/conf/configsrv.conf
PIDFile=/data/mongodb/config/log/configsrv.pid
# file size
LimitFSIZE=infinity
# cpu time
LimitCPU=infinity
# virtual memory size
LimitAS=infinity
# open files
LimitNOFILE=64000
# processes/threads
LimitNPROC=64000
# locked memory
LimitMEMLOCK=infinity
# total threads (user+kernel)
TasksMax=infinity
TasksAccounting=false
# Recommended limits for for mongod as specified in
# http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings
[Install]
WantedBy=multi-user.target
systemctl daemon-reload
systemctl start mongosrv.service
systemctl enable mongosrv.service
登錄任意一台配置服務器,初始化配置副本集
#連接
mongo --port 21000
#config變量
config = {
_id : "configs",
members : [
{_id : 0, host : "10.20.71.135:21000" },
{_id : 1, host : "10.20.73.182:21000" },
{_id : 2, host : "10.20.70.61:21000" }
]
}
#初始化副本集
rs.initiate(config)
其中,”_id” : “configs”應與配置文件中配置的 replicaction.replSetName 一致,”members” 中的 “host” 為三個節點的 ip 和 port
配置分片副本集(三台機器)
設置第一個分片副本集(shard1)
1. 配置文件
root@mgo-db01cn-p001:/data/mongodb/conf# egrep -v ^# shard1.conf
storage:
dbPath: /data/mongodb/shard1/data
journal:
enabled: true
systemLog:
destination: file
logAppend: true
path: /data/mongodb/shard1/log/shard1.log
net:
port: 27017
bindIp: 0.0.0.0
processManagement:
timeZoneInfo: /usr/share/zoneinfo
security:
keyFile: /data/mongodb/conf/key
authorization: enabled
replication:
replSetName: shard1
sharding:
clusterRole: "shardsvr"
2. 制作服務啟動文件
root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongod-shard1.service
[Unit]
Description=MongoDB Shard1 Database Server
After=network.target
Documentation=https://docs.mongodb.org/manual
[Service]
User=mongodb
Group=mongodb
EnvironmentFile=-/etc/default/mongod
ExecStart=/usr/bin/mongod --config /data/mongodb/conf/shard1.conf
PIDFile=/data/mongodb/shard1/log/shard1.pid
# file size
LimitFSIZE=infinity
# cpu time
LimitCPU=infinity
# virtual memory size
LimitAS=infinity
# open files
LimitNOFILE=64000
# processes/threads
LimitNPROC=64000
# locked memory
LimitMEMLOCK=infinity
# total threads (user+kernel)
TasksMax=infinity
TasksAccounting=false
# Recommended limits for for mongod as specified in
# http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings
[Install]
WantedBy=multi-user.target
啟動方式一:
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl daemon-reload
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl start mongod-shard1.service
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl status mongod-shard1.service
啟動方式二:
mongod -f /data/mongodb/conf/shard1.conf
登陸任意一台服務器,初始化副本集:
在任意一台服務上初始化復制集配置:
mongo --port 27017
#使用admin數據庫
use admin
#定義副本集配置,第三個節點的 "arbiterOnly":true 代表其為仲裁節點。
config = {
_id : "shard1",
members : [
{_id : 0, host : "10.20.71.135:27017" },
{_id : 1, host : "10.20.73.182:27017" },
{_id : 2, host : "10.20.70.61:27017", arbiterOnly: true }
]
}
#初始化副本集配置
rs.initiate(config);
rs.status()
rs.conf()
設置第二個分片副本集(shard2)
1. 配置文件
root@mgo-db01cn-p001:/data/mongodb/conf# egrep -v ^# shard2.conf
storage:
dbPath: /data/mongodb/shard2/data
journal:
enabled: true
systemLog:
destination: file
logAppend: true
path: /data/mongodb/shard2/log/shard2.log
net:
port: 27018
bindIp: 0.0.0.0
processManagement:
timeZoneInfo: /usr/share/zoneinfo
security:
keyFile: /data/mongodb/conf/key
authorization: enabled
replication:
replSetName: shard2
sharding:
clusterRole: "shardsvr"
2. 制作服務啟動文件
root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongod-shard2.service
[Unit]
Description=MongoDB Shard2 Database Server
After=network.target
Documentation=https://docs.mongodb.org/manual
[Service]
User=mongodb
Group=mongodb
EnvironmentFile=-/etc/default/mongod
ExecStart=/usr/bin/mongod --config /data/mongodb/conf/shard2.conf
PIDFile=/data/mongodb/shard2/log/shard2.pid
# file size
LimitFSIZE=infinity
# cpu time
LimitCPU=infinity
# virtual memory size
LimitAS=infinity
# open files
LimitNOFILE=64000
# processes/threads
LimitNPROC=64000
# locked memory
LimitMEMLOCK=infinity
# total threads (user+kernel)
TasksMax=infinity
TasksAccounting=false
# Recommended limits for for mongod as specified in
# http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings
[Install]
WantedBy=multi-user.target
啟動方式一:
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl daemon-reload
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl start mongod-shard2.service
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl status mongod-shard2.service
啟動方式二:
mongod -f /data/mongodb/conf/shard2.conf
登陸任意一台服務器,初始化副本集:
在任意一台服務上初始化復制集配置:
mongo --port 27018
#使用admin數據庫
use admin
#定義副本集配置,第三個節點的 "arbiterOnly":true 代表其為仲裁節點。
config = {
_id : "shard2",
members : [
{_id : 0, host : "10.20.71.135:27018" },
{_id : 1, host : "10.20.73.182:27018", arbiterOnly: true },
{_id : 2, host : "10.20.70.61:27018" }
]
}
#初始化副本集配置
rs.initiate(config);
設置第二個分片副本集(shard3)
1. 配置文件
root@mgo-db01cn-p001:/data/mongodb/conf# egrep -v ^# shard3.conf
storage:
dbPath: /data/mongodb/shard3/data
journal:
enabled: true
systemLog:
destination: file
logAppend: true
path: /data/mongodb/shard3/log/shard3.log
net:
port: 27019
bindIp: 0.0.0.0
processManagement:
timeZoneInfo: /usr/share/zoneinfo
security:
keyFile: /data/mongodb/conf/key
authorization: enabled
replication:
replSetName: shard3
sharding:
clusterRole: "shardsvr"
2. 制作服務啟動文件
root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongod-shard3.service
[Unit]
Description=MongoDB Shard3 Database Server
After=network.target
Documentation=https://docs.mongodb.org/manual
[Service]
User=mongodb
Group=mongodb
EnvironmentFile=-/etc/default/mongod
ExecStart=/usr/bin/mongod --config /data/mongodb/conf/shard3.conf
PIDFile=/data/mongodb/shard3/log/shard3.pid
# file size
LimitFSIZE=infinity
# cpu time
LimitCPU=infinity
# virtual memory size
LimitAS=infinity
# open files
LimitNOFILE=64000
# processes/threads
LimitNPROC=64000
# locked memory
LimitMEMLOCK=infinity
# total threads (user+kernel)
TasksMax=infinity
TasksAccounting=false
# Recommended limits for for mongod as specified in
# http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings
[Install]
WantedBy=multi-user.target
啟動方式一:
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl daemon-reload
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl start mongod-shard3.service
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl status mongod-shard3.service
啟動方式二:
mongod -f /data/mongodb/conf/shard3.conf
登陸任意一台服務器,初始化副本集:
mongo --port 27019
use admin
#定義副本集配置,第三個節點的 "arbiterOnly":true 代表其為仲裁節點。
config = {
_id : "shard3",
members : [
{_id : 0, host : "10.20.71.135:27019",arbiterOnly: true },
{_id : 1, host : "10.20.73.182:27019" },
{_id : 2, host : "10.20.70.61:27019" }
]
}
#初始化副本集配置
rs.initiate(config);
配置路由服務器 mongos
先啟動配置服務器和分片服務器,后啟動路由實例:(三台機器) 1. 配置文件
systemLog:
destination: file
logAppend: true
path: /data/mongodb/mongos/log/mongos.log
net:
port: 20000
bindIp: 0.0.0.0
processManagement:
timeZoneInfo: /usr/share/zoneinfo
security:
keyFile: /data/mongodb/conf/key
clusterAuthMode: keyFile
replication:
localPingThresholdMs: 15
sharding:
#監聽的配置服務器,只能有1個或者3個 configs為配置服務器的副本集名字
configDB: "configs/10.20.71.135:21000,10.20.73.182:21000,10.20.70.61:21000"
2. 制作服務啟動文件
root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongos.service
[Unit]
Description=MongoDB Mongos Database Server
After=network.target
Documentation=https://docs.mongodb.org/manual
[Service]
User=mongodb
Group=mongodb
EnvironmentFile=-/etc/default/mongod
ExecStart=/usr/bin/mongos --config /data/mongodb/conf/mongos.conf
PIDFile=/data/mongodb/mongos/log/mongos.pid
# file size
LimitFSIZE=infinity
# cpu time
LimitCPU=infinity
# virtual memory size
LimitAS=infinity
# open files
LimitNOFILE=64000
# processes/threads
LimitNPROC=64000
# locked memory
LimitMEMLOCK=infinity
# total threads (user+kernel)
TasksMax=infinity
TasksAccounting=false
# Recommended limits for for mongod as specified in
# http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings
[Install]
WantedBy=multi-user.target
啟動方式一:
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl daemon-reload
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl enable mongos
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl start mongos.service
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl status mongos.service
啟動方式二:
mongod -f /data/mongodb/conf/shard3.conf
3. 啟用分片 目前搭建了mongodb配置服務器、路由服務器,各個分片服務器,不過應用程序連接到mongos路由服務器並不能使用分片機制,還需要在程序里設置分片配置,讓分片生效。
mongo --port 20000
#使用admin數據庫
use admin
#串聯路由服務器與分配副本集
sh.addShard("shard1/10.20.71.135:27017,10.20.73.182:27017,10.20.70.61:27017")
sh.addShard("shard2/10.20.71.135:27018,10.20.73.182:27018,10.20.70.61:27018")
sh.addShard("shard3/10.20.71.135:27019,10.20.73.182:27019,10.20.70.61:27019")
#查看集群狀態
sh.status()
⚠️ : 集群服務啟動順序 mongodb的啟動順序是,先啟動配置服務器,在啟動分片,最后啟動mongos. configsvr->shard->mongos 至此,整個mongodb高可用集群就搭建好了。
部署測試
1. 先建一個database及user創建數據
# 創建一個admin用戶
$ mongo --port 20000
> use admin
> db.createUser({ user: "weadmin", pwd: "123456",roles: [{ role: "userAdminAnyDatabase", db: "admin" },{ role: "clusterManager", db : "admin"}],passwordDigestor: "server"})
> exit
# 創建一個database的訪問用戶
$ mongo --username weadmin --password 123456 --authenticationDatabase admin --port 20000 admin
> use test
> db.createUser({user: "test",pwd: "123456",roles: [{ role: "dbOwner", db: "test" }],passwordDigestor: "server"});
> exit
# 使用該用戶訪問database,並插入數據,創建索引
$ mongo --username test --password 123456 --authenticationDatabase test --port 20000 test
#插入測試數據
> for (var i = 1; i <= 5000; i++){db.table1.save({id:i,"name":"shuke"})};
> exit
2. 分片生效 目前配置服務、路由服務、分片服務、副本集服務都已經串聯起來了,但我們的目的是希望插入數據,數據能夠自動分片。連接在mongos上,准備讓指定的數據庫、指定的集合分片生效。
$ mongo --username weadmin --password 123456 --authenticationDatabase admin --port 20000 admin
> use admin
# 認證
> db.auth("weadmin", "123456")
#指定testdb分片生效
db.runCommand( { enablesharding :"test"});
#指定數據庫里需要分片的集合和片鍵
db.runCommand( { shardcollection : "test.table1",key : {id: 1} } )
我們設置testdb的 table1 表需要分片,根據 id 自動分片到 shard1 ,shard2,shard3 上面去。要這樣設置是因為不是所有mongodb 的數據庫和表 都需要分片!
3. 測試分片配置結果:
$ mongo --username test --password 123456 --authenticationDatabase test --port 20000 test
> use test
> db.auth("test", "123456")
#查看分片情況
> db.table1.stats();
總結
手工部署mongodb集群還是比較麻煩的,所以如果圖省事兒,還是使用雲廠商提供的PaaS服務好了,比如雲數據庫 MongoDB。如果一定要自己搭建,還是建議用現成的ansible-mongodb-cluster腳本好了。