之前介紹了Docker管理工具-Swarm部署記錄,這里簡單總結下Docker Swarm的日常維護命令,以作為平時運維筆記.
Swarm作為一個管理Docker集群的工具,首先需要將其部署起來,可以單獨將Swarm部署於一個節點。另外,自然需要一個Docker集群,集群上每一個節點均安裝有Docker。具體的Swarm架構圖可以參照下圖:

Swarm架構中最主要的處理部分自然是Swarm節點,Swarm管理的對象自然是Docker Cluster,Docker Cluster由多個Docker Node組成,而負責給Swarm發送請求的是Docker Client。Swarm架構圖可以讓大家對Swarm有一個初步的認識,比如Swarm的具體工作流程:Docker Client發送請求給Swarm;Swarm處理請求並發送至相應的Docker Node;Docker Node執行相應的操作並返回響應。除此之外,Swarm的工作原理依然還不夠明了。深入理解Swarm的工作原理,可以先從Swarm提供的命令入手。Swarm支持的命令主要有4個:swarm create、swarm manage、swarm join、swarm list。當然還有一個swarm help命令,該命令用於指導大家如何正確使用swarm命令.
swarm create
Swarm中swarm create命令用於創建一個集群標志,用於Swarm管理Docker集群時,Docker Node的節點發現功能。發起該命令之后,Swarm會前往Docker Hub上內建的發現服務中獲取一個全球唯一的token,用以唯一的標識Swarm管理的Docker集群。
swarm manage
Swarm中swarm manage是最為重要的管理命令。一旦swarm manage命令在Swarm節點上被觸發,則說明用戶需要swarm開始管理Docker集群。從運行流程的角度來講,swarm經歷的階段主要有兩點:啟動swarm、接收並處理Docker集群管理請求。
Swarm啟動的過程包含三個步驟:
► 發現Docker集群中的各個節點,收集節點狀態、角色信息,並監視節點狀態的變化;
► 初始化內部調度(scheduler)模塊;
► 創建並啟動API監聽服務模塊;
第一個步驟,Swarm發現Docker集群中的節點。發現(discovery)是Swarm中用於維護Docker集群狀態的機制。既然涉及到發現(discovery),那在這之前必須先有注冊(register)。Swarm中有專門負責發現(discovery)的模塊,而關於注冊(register)部分,不同的discovery模式下,注冊(register)也會有不同的形式。
目前,Swarm中提供了5種不同的發現(discovery)機制:Node Discovery、File Discovery、Consul Discovery、EtcD Discovery和Zookeeper Discovery。
第二個步驟,Swarm內部的調度(scheduler)模塊被初始化。swarm通過發現機制發現所有注冊的Docker Node,並收集到所有Docker Node的狀態以及具體信息。此后,一旦Swarm接收到具體的Docker管理請求,Swarm需要對請求進行處理,並通過所有Docker Node的狀態以及具體信息,來篩選(filter)決策到底哪些Docker Node滿足要求,並通過一定的策略(strategy)將請求轉發至具體的一個Docker Node。
第三個步驟,Swarm創建並初始化API監聽服務模塊。從功能的角度來講,可以將該模塊抽象為Swarm Server。需要說明的是:雖然Swarm Server完全兼容Docker的API,但是有不少Docker的命令目前是不支持的,畢竟管理Docker集群與管理單獨的Docker會有一些區別。當Swarm Server被初始化並完成監聽之后,用戶即可以通過Docker Client向Swarm發送Docker集群的管理請求。
Swarm的swarm manage接收並處理Docker集群的管理請求,即是Swarm內部多個模塊協同合作的結果。請求入口為Swarm Server,處理引擎為Scheduler,節點信息依靠Disocovery。
swarm join
Swarm的swarm join命令用於將Docker Node添加至Swarm管理的Docker集群中。從這點也可以看出swarm join命令的執行位於Docker Node,因此在Docker Node上運行該命令,首先需要在Docker Node上安裝Swarm,由於該Swarm只會執行swarm join命令,故可以將其當成Docker Node上用於注冊的agent模塊。
功能而言,swarm join可以認為是完成Docker Node在Swarm節點處的注冊(register)工作,以便Swarm在執行swarm manage時可以發現該Docker Node。然而,上文提及的5種discovery模式中,並非每種模式都支持swarm join命令。不支持的discovery的模式有Node Discovery與File Discovery。
Docker Node上swarm join執行之后,標志着Docker Node向Swarm注冊,請求加入Swarm管理的Docker集群中。Swarm通過注冊信息,發現Docker Node,並獲取Docker Node的狀態以及具體信息,以便處理Docker請求時作為調度依據。
swarm list
Swarm中的swarm list命令用以列舉Docker集群中的Docker Node。Docker Node的信息均來源於Swarm節點上注冊的Docker Node。而一個Docker Node在Swarm節點上注冊,僅僅是注冊了Docker Node的IP地址以及Docker監聽的端口號。
使用swarm list命令時,需要指定discovery的類型,類型包括:token、etcd、file、zk以及。而swarm list並未羅列Docker集群的動態信息,比如Docker Node真實的運行狀態,或者Docker Node在Docker集群中扮演的角色信息。
==========================下面簡單梳理了一些日常運維中用到的Swarm相關命令=============================
1) 初始化swarm manager並制定網卡地址
# docker swarm init --advertise-addr 182.48.115.237
2) 刪除集群,強制退出需要加–force (針對manager節點). 到各個節點上執行退出集群的命令
# docker node rm swarm-node1
# docker swarm leave --force //manager節點退出集群,需要加--force
3) 查看swarm worker的連接令牌
# docker swarm join-token worker
例如:
[root@manager-node ~]# docker swarm init --advertise-addr 182.48.115.237
Swarm initialized: current node (1gi8utvhu4rxy8oxar2g7h6gr) is now a manager.
To add a worker to this swarm, run the following command:
docker swarm join \
--token SWMTKN-1-4roc8fx10cyfgj1w1td8m0pkyim08mve578wvl03eqcg5ll3ig-f0apd81qfdwv27rnx4a4y9jej \
182.48.115.237:2377
To add a manager to this swarm, run 'docker swarm join-token manager' and follow the instructions.
4) 加入docker swarm集群,作為worker節點
利用上面執行結果中的命令放在其他節點上執行,則該節點加入到swarm集群中作為worker節點
[root@node1 ~]# docker swarm join --token SWMTKN-1-4roc8fx10cyfgj1w1td8m0pkyim08mve578wvl03eqcg5ll3ig-f0apd81qfdwv27rnx4a4y9jej 182.48.115.237:2377
This node joined a swarm as a worker.
5) 查看swarm manager的連接令牌
# docker swarm join-token manager
例如:
[root@swarm-manager-node ~]# docker swarm join-token manager
To add a manager to this swarm, run the following command:
docker swarm join \
--token SWMTKN-1-075gaitl18z3v0p37sx7i5cmvzjjur0fbuixzp4tun0xh0cikd-0y8ttp5h0g54j10amn670w6su \
172.16.60.220:2377
6) 加入docker swarm集群,作為manager節點
利用上面執行結果中的命令放在其他節點上執行,則該節點加入到swarm集群中作為manager管理節點,狀態為reachable.
[root@swarm-manager-node2 ~]# docker swarm join --token SWMTKN-1-075gaitl18z3v0p37sx7i5cmvzjjur0fbuixzp4tun0xh0cikd-0y8ttp5h0g54j10amn670w6su 172.16.60.220:2377
This node joined a swarm as a manager.
[root@swarm-manager-node2 ~]# docker node ls
ID HOSTNAME STATUS AVAILABILITY MANAGER STATUS
rpbey5t1v14olke2mgtc430de swarm-node2 Ready Active
u6gkfr4j19gq16ddyb76fxsl3 swarm-node1 Ready Active
vwbb0imil512a1le04bnkx98u * swarm-manager-node Ready Active Leader
ybjvaszg838upeqvvzswhq0tt swarm-manager-node2 Ready Active Reachable
如果之前的leader狀態的manager管理節點掛了后(假如systemctl stop docker, 然后再systemctl start docker),
則新加入的manager節點狀態由reachable變為leader, 之前的manager節點狀態為unreachable.
[root@swarm-manager-node2 ~]# docker node ls
ID HOSTNAME STATUS AVAILABILITY MANAGER STATUS
rpbey5t1v14olke2mgtc430de swarm-node2 Ready Active
u6gkfr4j19gq16ddyb76fxsl3 swarm-node1 Ready Active
vwbb0imil512a1le04bnkx98u * swarm-manager-node Ready Active Unreachable
ybjvaszg838upeqvvzswhq0tt swarm-manager-node2 Ready Active Leader
7) 使舊令牌無效並生成新令牌
# docker swarm join-token --rotate
8) 查看集群中的節點
# docker node ls
9) 查看集群中節點信息
# docker node inspect swarm-node1 --pretty
10) 調度程序可以將任務分配給節點
# docker node update --availability active swarm-node1
11) 調度程序不向節點分配新任務,但是現有任務仍然保持運行
# docker node update --availability pause swarm-node1
12) 調度程序不會將新任務分配給節點。調度程序關閉任何現有任務並在可用節點上安排它們. 也就是線下節點,不參與任務分配.
# docker node update --availability drain swarm-node1
13) 添加節點標簽
# docker node update --label-add label1 --label-add bar=label2 swarm-node1
14) 刪除節點標簽
# docker node update --label-rm label1 swarm-node1
15) 將worker節點升級為manager節點
# docker node promote swarm-node1
16) 將manager節點降級為worker節點
# docker node demote swarm-manager-node
17) 查看服務列表
# docker service ls
18) 查看服務的具體信息
# docker service ps my-test
19) 創建一個不定義name,不定義replicas的服務. (如下的nginx是docker的nginx鏡像名稱,不是服務名稱)
# docker service create nginx
20) 創建一個指定name的服務
# ocker service create --name my-nginx nginx
21) 創建一個指定name、run cmd的服務
# docker service create --name my-nginx nginx ping www.baidu.com
22) 創建一個指定name、version、run cmd的服務
# docker service create --name my-redis redis:3.0.6
# docker service create --name my-nginx nginx:1.8 /bin/bash
23) 創建一個指定name、port、replicas的服務
# docker service create --name my-nginx --replicas 3 -p 80:80 nginx
24) 為指定的服務更新一個端口
# docker service update --publish-add 80:80 my-nginx
25) 為指定的服務刪除一個端口
# docker service update --publish-rm 80:80 my-nginx
26) 將redis:3.0.6更新至redis:3.0.7
# docker service update --image redis:3.0.7 redis
27) 配置運行環境,指定工作目錄及環境變量
# docker service create --name my-nginx --env MYVAR=myvalue --workdir /data/www --user my_user nginx ping www.baidu.com
28) 創建一個my-nginx的服務
# docker service create --name my-nginx nginx ping www.baidu.com
29) 更新my-nginx服務的運行命令
# docker service update --args "ping www.baidu.com" my-nginx
30) 刪除一個服務
# docker service rm my-nginx
31) 在每個群組節點上運行web服務
# docker service create --name tomcat --mode global --publish mode=host,target=8080,published=8080 tomcat:latest
32) 創建一個overlay網絡
# docker network create --driver overlay my-network
# docker network create --driver overlay --subnet 10.10.10.0/24 --gateway 10.10.10.1 haha-network
33) 創建服務並將網絡添加至該服務
# docker service create --name my-test --replicas 3 --network my-network redis
34) 刪除群組網絡
# docker service update --network-rm my-network my-test
35) 更新群組網絡
# docker service update --network-add haha-network my-test
36) 創建群組並配置cpu和內存
# docker service create --name my_nginx --reserve-cpu 2 --reserve-memory 512m --replicas 3 nginx
37) 更改所分配的cpu和內存
# docker service update --reserve-cpu 1 --reserve-memory 256m my_nginx
38) 創建服務時自定義的幾個參數
指定每次更新的容器數量
--update-parallelism
指定容器更新的間隔
--update-delay
定義容器啟動后監控失敗的持續時間
--update-monitor
定義容器失敗的百分比
--update-max-failure-ratio
定義容器啟動失敗之后所執行的動作
--update-failure-action
比如:創建一個服務並運行3個副本,同步延遲10秒,10%任務失敗則暫停
# docker service create --name mysql_5_6_36 --replicas 3 --update-delay 10s --update-parallelism 1 --update-monitor 30s --update-failure-action pause --update-max-failure-ratio 0.1 -e MYSQL_ROOT_PASSWORD=123456 mysql:5.6.36
39) 回滾至之前版本
# docker service update --rollback mysql
自動回滾
如果服務部署失敗,則每次回滾2個任務,監控20秒,回滾可接受失敗率20%
# docker service create --name redis --replicas 6 --rollback-parallelism 2 --rollback-monitor 20s --rollback-max-failure-ratio .2 redis:latest
40) 創建服務並將目錄掛在至container中
# docker service create --name mysql --publish 3306:3306 --mount type=bind,src=/data/mysql,dst=/var/lib/mysql --replicas 3 -e MYSQL_ROOT_PASSWORD=123456 mysql:5.6.36
需要注意使用bind綁定宿主機目錄會帶來的風險
- 綁定的主機路徑必須存在於每個集群節點上,否則會有問題;
- 調度程序可能會在任何時候重新安排運行服務容器,如果目標節點主機變得不健康或無法訪問;
- 主機綁定數據不可移植,當你綁定安裝時,不能保證你的應用程序開發方式與生產中的運行方式相同;
41) 添加swarm配置
# echo "this is a mysql config" | docker config create mysql -
42) 查看配置
# docker config ls
查看配置詳細信息
# docker config inspect mysql
43) 刪除配置
# docker config rm mysql
44) 添加配置
# docker service update --config-add mysql mysql
45) 刪除配置
# docker service update --config-rm mysql mysql
46) 添加配置
# docker config create kevinpage index.html
47) 啟動容器的同時添加配置(target如果報錯,就使用dst或destination)
# docker service create --name nginx --publish 80:80 --replicas 3 --config src=kevinpage,target=/usr/share/nginx/html/index.html nginx
